期待崩塌：GPT-5，输给了香蕉｜赛博月刊 2509

赛博禅心 · 公众号 · 硬件 AI · 2025-09-22 10:47

主要观点总结

本月份，AI技术在语言模型、图像、视频、音频、3D、具身智能、Agent、Coding和应用等领域均有显著进展。其中，语言模型方面，GPT-5和开源的GPT-OSS系列发布，但并未带来质的改变；图像领域，Qwen-Image被Nano-Banana超越，预示图片编辑领域将被AI接管；视频领域，数字人模型更新加快，但基础视频模型变化不大；音频领域稳步前进，但仍有小瑕疵待解决；3D领域分为单物体生成和世界生成两个方向，均有进展但难定胜负；具身智能进展缓慢，核心模型尚不成熟；Agent向多Agent协作演进，AI浏览器赛道降温；Coding领域呈现三个趋势：Agent云端化、终端化和交互模式进化；应用方向，国内外公司风格迥异，国内注重产品功能加AI，海外注重集成和数据共享。

关键观点总结

关键观点1: 语言模型

8月可谓语言模型的集中更新月，OpenAI发布了GPT-5和开源的GPT-OSS系列，Claude上线Opus-4.1，DeepSeek推出混合推理模型V3.1，国内厂商也发布了各类开源模型，但新模型问世并未带来质的改变，模型能力提升的边际价值持续递减。

关键观点2: 图像

Qwen-Image被Nano-Banana超越，预示图片编辑领域将被AI完全接管，门槛降至极低，甚至可能免费普及，我们或将迎来一个90%的图片由AI生成的互联网。

关键观点3: 视频

本月数字人模型更新与开源的速度明显加快，但基础视频模型变化不大，数字人技术的成熟将催生出海量的AI商品讲解员与AI主播，但问题是我们真的想看那么多数字人吗？

关键观点4: 音频

音频领域稳步前进，但仍有小瑕疵待解决，如情绪控制、音色一致性、多语种的自然度等，Nano-Banana的出现将解决这些问题，催生新的应用。

关键观点5: 3D

3D领域分为单物体生成和世界生成两个方向，均有进展但难定胜负，尤其是在垂直领域，针对特定任务的小参数模型潜力远未被挖掘。

关键观点6: 具身智能

人形机器人的进展依旧缓慢，其“大脑”——核心模型尚未成熟，英伟达Jetson Thor开发套件揭示了其本质，但现有AI算力不足以支撑人形机器人的全部需求。

关键观点7: Agent

通用Agent向多Agent协作演进，AI浏览器赛道降温，Claude选择推出的是浏览器插件，这可能对其他厂商的战略方向产生影响。

关键观点8: Coding

AI Coding领域呈现三个趋势：Agent云端化、终端化和交互模式进化，如JetBrains推出的跨行自动补全功能和Claude Code的解释性编程教学。

关键观点9: 应用

应用方向，国内外公司风格迥异，国内公司注重产品功能加AI，而海外公司更注重集成，商业上，国内巨头这样做无可厚非，但对用户来说，或许是在悄悄夺走他们的选择权。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博