|
到底谁能把强化学习推理大模型,弄上业务一线赚钱? 亲爱的数据 · 公众号 · · 3 天前 · |
|
尺寸差了一个量级,如何较量?DeepSeek R1与阿里QwQ-32B 亲爱的数据 · 公众号 · · 4 月前 · |
|
DeepSeek:为了这口醋,包了这顿饺子,为了数据,我造了模型 亲爱的数据 · 公众号 · · 5 月前 · |
|
对抗NVLink简史?10万卡争端,英伟达NVL72超节点挑起 亲爱的数据 · 公众号 · · 8 月前 · |
|
前所未有:GPU集群恶意代码注入?模型投毒?资源消耗攻击? 亲爱的数据 · 公众号 · · 9 月前 · |
|
独家丨科大讯飞多模态:都说端到端好,看谁有本事先做出来 亲爱的数据 · 公众号 · 科技自媒体 · 10 月前 · |
|
智谱清影做“Stable Diffusion”,生数科技做“Midjourney”? 亲爱的数据 · 公众号 · · 11 月前 · |
|
Llama 3.1模型有4050亿参数量,还是保守了? 亲爱的数据 · 公众号 · · 11 月前 · |
|
机会在哪?原理是啥?哈佛辍学融资1.2亿造AI芯片 亲爱的数据 · 公众号 · · 1 年前 · |