DeepSeek R1不编程就能生成GPU内核，比熟练工程师好，惊到了英伟达

AII大模型 · 公众号 · · 2025-02-14 00:00

文章预览

来源 | 机器之心 DeepSeek 引爆 AI 社区后，人们都在尝试本地部署和各领域应用，在新模型基础上持续改进的方向也被不断提出。与此同时，英伟达却在尝试用 DeepSeek 给大模型 pipeline 本身搞自动化。本周三，英伟达在博客中介绍了利用 DeepSeek-R1 和推理时扩展技术来自动生成优化 GPU 内核的最新研究成果，效果异常的好。对此有人评价道：难不成英伟达在自拆护城河？也有人已经开始担心自己的工作会不会被 AI 代替了。随着 AI 大模型规模不断扩展，能力持续进步，测试时扩展（TTS：Test-Time Scaling）或推理时扩展（Inference-Time Scaling）法则正在兴起。这项技术也被称为 AI 推理或长思考，它通过在推理过程中分配额外的计算资源来评估多种可能的结果，然后选择最佳的一个，从而提高模型整体性能。推理能力的加强使得 AI 初步掌握了类似于人类剖析复 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博