主要观点总结
本文介绍了近期大模型、端侧模型以及AI技术的发展和进步,包括面壁智能发布的端侧模型MiniCPM-4的技术亮点和规模法则可持续发展问题,苹果全球开发者大会(WWDC 2025)和「Advancing AI 2025」活动的预告及相关内容。文章还涉及训练后量化和量化感知训练的技术问题以及AMD在人工智能方面的愿景和新产品技术介绍。
关键观点总结
关键观点1: 大模型的知识密度正极速提升,训练成本加速降低。
从ChatGPT到多模态与具身智能的崛起,显示出大模型的快速发展。
关键观点2: 面壁智能发布端侧模型MiniCPM-4,实现超高稀疏度和极速响应。
模型具有5%的超高稀疏度,实现220倍极速响应,并解锁了端侧128K上下文。
关键观点3: 规模法则可持续发展问题受到关注。
随着模型参数的增长,训练成本将成为无法承受之重,引发对可持续发展的思考。
关键观点4: 苹果全球开发者大会(WWDC 2025)将发布全新系统,包括iOS 19、iPadOS 19等。
大会将展示前所未有的视觉设计变革和Apple Intelligence技术的深度整合。
关键观点5: AMD在人工智能方面有大胆愿景,将推出新产品和技术。
活动将介绍基于「CDNA4」架构及3nm制程的下一代Instinct GPU——MI350系列加速器,以及ROCm开放软件生态系统的最新进展。
文章预览
点击上方卡片关注👆 从 ChatGPT 发布到各大模型出世百家争鸣,再到今年多模态与具身智能的崛起,大模型的知识密度正极速提升,而训练成本加速降低,甚至已经坍缩到最初的 1% 。 本周,知乎日报正式推出 「科技周报」 栏目,我们将每周为大家更新科技圈大小事,欢迎阅读、评论、转发~ 一起来看看科技圈有哪些值得关注的事,以及将有哪些事发生吧👇🏻 💥本周大事记 面壁智能在北京智源大会上发布代号「前进四」的小钢炮模型 MiniCPM4.0。 当科技巨头在「更大、更全能」的云端竞技场厮杀时,一条隐秘的技术分水岭已然浮现:让 AI 算力挣脱桎梏,在端侧唤醒「原生智能」。 6 月 6 日,面壁智能发布端侧模型 MiniCPM-4—— 5% 超高稀疏度实现 220 倍极速响应,首次在英特尔平台解锁端侧 128K 上下文,更以 1/4 缓存占用量超越 Gemma3-12B 性能。 哪
………………………………