英伟达Blackwell称霸MLPerf！推理性能暴涨30倍，新一代「AI怪兽」诞生

机器学习研究组订阅 · 公众号 · AI · 2024-08-29 19:18

文章预览

大语言模型（LLM）推理是一个全栈挑战。为了实现高吞吐量、低延迟的性能，不仅需要强大的GPU，还需要高带宽的芯片互连技术、高效的加速库以及高度优化的推理引擎。就在刚刚，MLCommons发布了基准测试套件MLPerf Inference v4.1的最新测试结果，此次发布涵盖了专家混合（MoE）模型架构的首次评测结果，展示了与推理功耗相关的新发现。 MLCommons在最新的AI基准测试中添加了MoE模型 MLPerf是一个流行且得到广泛认可的测试套件，以架构中立、具有代表性和可重复的方式提供机器学习系统的性能基准测试，每年更新两次本轮测试的参赛者如下： AMD MI300x加速器（已上市） AMD EPYC 「Turin」 CPU（预览版） Google 「Trillium」 TPUv6e加速器（预览版） Intel 「Granite Rapids」 Xeon CPU（预览版） NVIDIA 「Blackwell」 B200加速器（预览版） UntetherAI SpeedAI 240 Slim（已上市）和Speed ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 《爱可可微博热门分享(5.2)》爱可可微博热门分享(5.2)-20250502225112

19 小时前

机器学习研究组订阅 · 全球首个AI科学家天团出道！007做实验碾压人类博士，生化环材圈巨震

19 小时前

宝玉xp · 做成了个天气 GPTs：网页链接输入城市名就可以获取当前天气并生-20250502125754

昨天

爱可可-爱生活 · 【[883星]Gemini Balance：为Google Ge-20250430200222

2 天前

新智元 · 人人都能有一个满血DeepSeek？清华90后出手，10万块畅玩FP8原版

3 天前

HyperAI超神经 · 不是取代，而是共生！气象科学的未来需要AI与数值预报的有机结合

9 月前

北大青年CEO俱乐部 · 倒计时2天｜3月7日第六届北大青年CEO俱乐部创业女神节

1 月前