专栏名称: 极思TopMinds
青年投资家俱乐部旗下新型科创产业服务平台,原硅谷密探,科技转化第一站,科学家CEO的摇篮。旨在为全球海外人才创业项目提供产业加速、政策对接支持、投融资对接、加速落地等孵化赋能服务,助力国家的科技兴国计划。
今天看啥  ›  专栏  ›  极思TopMinds

速递丨成本仅50美元!李飞飞团队复刻媲美DeepSeek R1的AI推理模型

极思TopMinds  · 公众号  ·  · 2025-02-06 19:29
    

文章预览

根据Tech Crunch报道, 李飞飞等斯坦福大学和华盛顿大学的AI研究人员的一篇新研究论 文表示,他们成功地用不到50美元的费用训练了一个AI推理模型。 这个名为s1的模型,在测量数学和编码能力的测试中,表现与最前沿的推理模型(如OpenAI的o1和DeepSeek的R1)相似。 s1模型已经在GitHub上发布,并附带了训练它所用的数据和代码。 s1背后的团队表示,他们从一个现成的基础模型开始,然后通过蒸馏(distillation)对其进行微调,这是一个从另一个AI模型中提取“推理”能力的过程,通过训练其答案来实现。 研究人员表示,s1是通过蒸馏Google的推理模型——Gemini 2.0 Flash Thinking Experimental模型获得的。蒸馏方法与伯克利研究人员上个月以约450美元创建AI推理模型的方式相同。 对于一些人来说,几位没有数百万美元资金支持的研究人员仍能在AI领域进行创新的想法 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览