8x7B MoE与Flash Attention 2结合，不到10行代码实现快速推理

机器学习研究组订阅 · 公众号 · AI · 2023-12-31 17:44

感兴趣的小伙伴，可以跟着操作过程试一试。前段时间，Mistral AI 公布的 Mixtral 8x7B 模型爆火整个开源社区，其架构与 GPT-4 非常相似，很多人将其形容为 GPT-4 的「缩小版」。我们都知道，OpenAI 团队一直对 GPT-4 的参数量和训练细节守口如瓶。Mistral 8x7B 的放出，无疑给广大开发者提供了一种「非常接近 GPT-4」的开源选项。在基准测试中，Mistral 8x7B 的表现优于 Llama 2 70B，在大多数标准基准测试上与 GPT-3.5 不相上下，甚至略胜一筹。图源：https://mistral.ai/news/mixtral-of-experts/随着这项研究的出现，很多人表示：「闭源大模型已经走到了结局。」短短几周的时间，机器学习爱好者 Vaibhav (VB) Srivastav 表示：随着 AutoAWQ（支持 Mixtral、LLaVa 等模型的量化）最新版本的发布，现在用户可以将 Mixtral 8x7B Instruct 与 Flash Attention 2 结合使用，达到快速推理的目的，实现这一 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

宝玉xp · //@程序员邹欣://@关关雎鸠杰伦:名字有韦的路过，因为普通话-20240517134706

18 小时前

宝玉xp · 被筛选的也会用AI陪聊，最后都是AI对聊，老黄卖显卡赢麻了//@-20240517120138

19 小时前

黄建同学 · 这两天除了OpenAI和Google发布模型，腾讯也发布了混元--20240516073452

2 天前

爱可可-爱生活 · 《爱可可微博热门分享(5.15)》爱可可微博热门分享(5.1-20240515220907

2 天前

宝玉xp · 转发微博-20240513135158

4 天前

车知知 · 2024年第一期：BMS硬件关键技术、设计与应用培训开始报名！（总第6期）

3 月前

何夕 · 985应届毕业生，要么进入体制内，要么进央企，要么进华为阿里腾讯-20200823113203

3 年前

YuYang说 · 转发微博-20190801152222

4 年前

全球宏观与市场 · 这是一份只有800字的极简版政府工作报告

6 年前

创业邦 · iPhone曝新漏洞，一条短信可致死机；华为业务造假，任正非自罚100万刷屏；微信打击假货，封杀数百个小程序|早报

6 年前