今天看啥  ›  专栏  ›  信息平权

GB200的性能成本定量分析

信息平权  · 公众号  ·  · 2024-04-10 20:26
Dylan老哥状态回来了!自从我圣诞节前给Semianalysis付了费,先不提他去休假1个月啥玩意都没更,回来更的那叫一个水....甚至之前那篇GB200属于是抄亚洲作业了。但这一次,大哥终于更新了一篇像样的,让我觉得5000块没白花。文章增量在于,在我们之前定性的分析GB200优点基础上(这一代的精髓就在NVL 72(重发),老哥提供了一大堆定量图表(堪比NV内部跑perf仿真了...),非常值得品读。先把学习委员Y博的总结放前面:“我们之前定性的判断了NVL72这种交换结构下实现的超大GPU-GPU带宽对于推理成本的大幅度降低具备极大意义, 从SA的文章来看, 当初我们的判断得到了定量的证明. 基于SA的数据, 为了实现更好的推理性能, 接下来包括NV, Intel, Google, AMD还有国内的几家, 如果要在推理市场严肃的参与这场战斗, 各家追求实现相同规模和性能的GPU间的互联能力 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照