对话中国信通院魏凯：AI下半场，大模型要少说话，多做事

中国企业家杂志 · 公众号 · 职场 · 2025-07-01 08:00

主要观点总结

本文介绍了中国信息通信研究院的大模型评测团队对国内外模型性能的观察，以及国内模型如DeepSeek的表现。团队负责人魏凯讨论了当前大模型的发展趋势，包括训练方法和应用场景，也强调了“方升”大模型基准测试体系的重要性及其特点。

国内模型表现一直很好，而且排名经常变动。大模型的更新频率加快，竞争非常激烈。

魏凯提到，大模型的竞争非常激烈，排名变化很快。现在模型能力比拼不仅仅是基础能力，还要看重能否做好实际工作。他也提到AI在下半场要注重提高实际应用能力和产业实战应用。

他解释了方升与传统的基准测试的不同之处，包括题目设计更注重产业应用、测试方法的标准化和公开透明等。他还强调方升的目的是推动大模型解决高价值场景中的关键问题，提高AI赋能实体经济的效能。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

蜜蜂有料 · 某外企强制上四休三，全面降薪20%

昨天

人力资源管理 · “一脚蹬”火了！好穿到原地跳高！超有气质的一字带半拖，一脚蹬设计，简约百搭，穿着率真的高！

昨天

猎聘 · 职场中，90%的人都吃过“不会沟通”的亏

昨天

人力资源研究 · 人社部发钱！中级经济师最高可领2.4万补贴！

昨天

HR成长社 · 用了半年的DeepSeek后，才发现DeepSeek虽然好用，但离解决HR的工作问题还很远。 DeepSeek回答HR的问题，还不够准确；DeepSeek完成HR的任务，不能交付完整结果，比如制度....

2 天前

宁南山 · 美国智库调研了20个月，发现了中国制造的弱点

8 月前

春江潮起 · 百亿巨头旗下“零添加”酱油惊现致癌物，“零添加”成噱头？股价四天蒸发9.5亿！

3 月前