文章预览
🍹 Insight Daily 🪺 Aitrainee | 公众号:AI进修生 Hi,这里是Aitrainee,欢迎阅读本期新文章。 在本文中,我将介绍Ollama最近对Llama 3.2 Vision的支持更新,并分享Llama 3.2 Vision的实测结果。同时,我还将介绍 一个视觉RAG系统 ,展示如何将Llama 3.2 Vision与该系统结合,完成基于视觉RAG检索的任务。 先介绍此次更新: Ollama 现在正式支持 Llama 3.2 视觉模型(Llama 3.2 Vision)。 你看就像这样拖进去就可以识别图片了。 ▲ 来源 | Prompt Engineering 你可以看到该模型有11B参数版和90B参数版。选择90B参数版时,文件大小约为55GB。当然还有一些量化的版本。 Llama 3.2 Vision 11B 至少需要 8GB VRAM,而 90B 型号至少需要 64 GB VRAM。 为了安装它, 你需要更新一下ollama,这里以docker安装的ollama为例,没更新前拉取这个视觉模型不成功,我们需要删掉容器,再pull更新它。 更新完之
………………………………