文章预览
时隔 1 个月,面壁小钢炮 MiniCPM 系列上新,带来 MiniCPM-Llama3-V 2.5 8B ,最强端侧多模态模型。 小钢炮系列通过一系列自研技术,所开创的高清图像识别(1344*1344 分辨率)、强大的 OCR 能力等,本次仍得到了延续。 8B 体量的新一代 MiniCPM-Llama3-V 2.5,仍带来一系列惊艳亮点。 最强端侧多模态综合性能 : 超越多模态巨无霸 Gemini Pro 、GPT-4V OCR 能力 SOTA !180 万 像素更清晰,难图长图长文本精准识别 量化后仅 8G 显存 ,4070 显卡轻松推理,并可在手机端以 6-8Tokens/s 速度高效运行; 图像编码快 150 倍 ! 首次端侧系统级多模态加速; 支持 30+ 多种语言 MiniCPM-Llama3-V 2.5 发布后火速登顶 HuggingFace 和 Github 双榜榜首,与 Meta、微软、谷歌等科技巨头共同从全球 66 万模型中脱颖而出。 当前 MiniCPM-V 系列下载总量已超 13 万,GitHub 星标 2K+。 ▲ 新版本MiniCPM-V小钢
………………………………