看啥推荐读物
专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

1元=1700000tokens!清华系发布国产Mistral仅2B,老手机都带得动,GitHub一天斩获300+星

量子位  · 公众号  · AI  · 2024-02-02 15:30
金磊 发自 凹非寺量子位 | 公众号 QbitAI一个体量仅为2B的大模型,能有什么用?答案可能超出你的想象。因为若是用四个字来概括,那就是“多、快、好、省”:多:它是业界第一个在端侧部署多模态的大模型。快:一张1080Ti可高效微调、一台机器可以持续训练。好:性能跟体量极具反差感,在多项成绩中超越了一众主流“大体量”大模型。省:1元=1700000 tokens,成本为Mistral-Medium百分之一那么,这个能够“以小博大”,颇有四两拨千斤意味的大模型,到底什么来头?不卖关子,它正是由清华系初创公司面壁智能最新发布的旗舰终端大模型——MiniCPM。并且团队还给它起了个别具一格的昵称——小钢炮。而在众多亮点之间,最令人意外的还是小钢炮用2B的“姿势”所表现出来的性能。例如与同样是采用“以小博大”路数的大模型标杆之作Mistral-7B做比较 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照