专栏名称: AII大模型
分享大模型相关最新技术、信息、趋势和资料,享受分享的快乐,感谢关注。
今天看啥  ›  专栏  ›  AII大模型

DeepSeek R1不编程就能生成GPU内核,比熟练工程师好,惊到了英伟达

AII大模型  · 公众号  ·  · 2025-02-14 00:00
    

文章预览

来源 | 机器之心 DeepSeek 引爆 AI 社区后,人们都在尝试本地部署和各领域应用,在新模型基础上持续改进的方向也被不断提出。与此同时,英伟达却在尝试用 DeepSeek 给大模型 pipeline 本身搞自动化。 本周三,英伟达在博客中介绍了利用 DeepSeek-R1 和推理时扩展技术来自动生成优化 GPU 内核的最新研究成果,效果异常的好。 对此有人评价道:难不成英伟达在自拆护城河? 也有人已经开始担心自己的工作会不会被 AI 代替了。 随着 AI 大模型规模不断扩展,能力持续进步,测试时扩展(TTS:Test-Time Scaling)或推理时扩展(Inference-Time Scaling)法则正在兴起。这项技术也被称为 AI 推理或长思考,它通过在推理过程中分配额外的计算资源来评估多种可能的结果,然后选择最佳的一个,从而提高模型整体性能。 推理能力的加强使得 AI 初步掌握了类似于人类剖析复 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览