主要观点总结
本文报道了DeepSeek发布Prover-V2模型、小米开源「Xiaomi MiMo」大模型、谷歌NotebookLM的音频概览功能新增76种语言支持、Meta公布财报、微软营收、苹果在印度布局、宁德时代港股上市、饿了么百亿补贴、英伟达新工具开放使用、Meta第三代雷朋联名智能眼镜发布、荣耀手表全新系列以及纽约地铁探索引入AI技术等科技新闻。
关键观点总结
关键观点1: DeepSeek发布Prover-V2模型
DeepSeek于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型,使用了更高效的safetensors文件格式,支持多种计算精度,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。
关键观点2: 小米开源「Xiaomi MiMo」大模型
小米大模型团队宣布开源首个「为推理而生」的大模型Xiaomi MiMo,通过数据和算法等多层面的创新驱动推理能力的提升,包括预训练、数据、训练和后训练等方面的创新。
关键观点3: 谷歌NotebookLM的音频概览功能新增76种语言支持
谷歌宣布其基于人工智能的笔记和研究助手工具NotebookLM的音频概览功能新增76种语言支持,旨在通过虚拟主持人根据用户上传的文档生成播客,帮助用户以另一种方式理解和消化文档中的信息。
关键观点4: Meta公布财报
Meta公司公布2025财年一季度财报,营收达423.14亿美元,同比增长16%;净利润166.44亿美元,同比增长35%。Meta在财报中交出了一份亮眼的成绩单。
关键观点5: 其他科技公司动态
包括微软第三季度营收、苹果在印度布局、宁德时代港股上市、饿了么百亿补贴、英伟达新工具开放使用、Meta第三代雷朋联名智能眼镜发布、荣耀手表全新系列以及纽约地铁探索引入AI技术等科技新闻。
文章预览
DeepSeek 发布 Prover-V2 模型,参数量达 6710 亿 4 月 30 日消息,DeepSeek 于 AI 开源社区 Hugging Face 上发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。 据悉,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达 6710 亿,或为去年发布的 Prover-V1.5 数学模型升级版本。在模型架构上,该模型使用了 DeepSeek-V3 架构,采用 MoE(混合专家)模式,具有 61 层 Transformer 层,7168 维隐藏层。同时支持超长上下文,最大位置嵌入达 16.38 万,使其能处理复杂的数学证明,并且采用了 FP8 量化,可通过量化技术减小模型大小,提高推理效率。(来源:新浪科技) 小米开源「Xiaomi MiMo」大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini 4 月 30 日消息,小米大模型团队通过「Xiaomi MiMo」公众号宣布,小米开源首
………………………………