DeepSeek 发布 Prover-V2 模型；小米首个推理大模型开源；饿了么宣布超百亿补贴加入外...

极客公园 · 公众号 · 科技媒体 · 2025-05-01 09:08

主要观点总结

本文报道了DeepSeek发布Prover-V2模型、小米开源「Xiaomi MiMo」大模型、谷歌NotebookLM的音频概览功能新增76种语言支持、Meta公布财报、微软营收、苹果在印度布局、宁德时代港股上市、饿了么百亿补贴、英伟达新工具开放使用、Meta第三代雷朋联名智能眼镜发布、荣耀手表全新系列以及纽约地铁探索引入AI技术等科技新闻。

关键观点总结

关键观点1: DeepSeek发布Prover-V2模型

DeepSeek于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型，使用了更高效的safetensors文件格式，支持多种计算精度，参数达6710亿，或为去年发布的Prover-V1.5数学模型升级版本。

关键观点2: 小米开源「Xiaomi MiMo」大模型

小米大模型团队宣布开源首个「为推理而生」的大模型Xiaomi MiMo，通过数据和算法等多层面的创新驱动推理能力的提升，包括预训练、数据、训练和后训练等方面的创新。

关键观点3: 谷歌NotebookLM的音频概览功能新增76种语言支持

谷歌宣布其基于人工智能的笔记和研究助手工具NotebookLM的音频概览功能新增76种语言支持，旨在通过虚拟主持人根据用户上传的文档生成播客，帮助用户以另一种方式理解和消化文档中的信息。

关键观点4: Meta公布财报

Meta公司公布2025财年一季度财报，营收达423.14亿美元，同比增长16%；净利润166.44亿美元，同比增长35%。Meta在财报中交出了一份亮眼的成绩单。

关键观点5: 其他科技公司动态

包括微软第三季度营收、苹果在印度布局、宁德时代港股上市、饿了么百亿补贴、英伟达新工具开放使用、Meta第三代雷朋联名智能眼镜发布、荣耀手表全新系列以及纽约地铁探索引入AI技术等科技新闻。

文章预览

DeepSeek 发布 Prover-V2 模型，参数量达 6710 亿 4 月 30 日消息，DeepSeek 于 AI 开源社区 Hugging Face 上发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据悉，DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式，并支持多种计算精度，方便模型更快、更省资源地训练和部署，参数达 6710 亿，或为去年发布的 Prover-V1.5 数学模型升级版本。在模型架构上，该模型使用了 DeepSeek-V3 架构，采用 MoE（混合专家）模式，具有 61 层 Transformer 层，7168 维隐藏层。同时支持超长上下文，最大位置嵌入达 16.38 万，使其能处理复杂的数学证明，并且采用了 FP8 量化，可通过量化技术减小模型大小，提高推理效率。（来源：新浪科技）小米开源「Xiaomi MiMo」大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini 4 月 30 日消息，小米大模型团队通过「Xiaomi MiMo」公众号宣布，小米开源首 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博