专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
目录
今天看啥  ›  专栏  ›  极客公园

DeepSeek 发布 Prover-V2 模型;小米首个推理大模型开源;饿了么宣布超百亿补贴加入外...

极客公园  · 公众号  · 科技媒体  · 2025-05-01 09:08
    

主要观点总结

本文报道了DeepSeek发布Prover-V2模型、小米开源「Xiaomi MiMo」大模型、谷歌NotebookLM的音频概览功能新增76种语言支持、Meta公布财报、微软营收、苹果在印度布局、宁德时代港股上市、饿了么百亿补贴、英伟达新工具开放使用、Meta第三代雷朋联名智能眼镜发布、荣耀手表全新系列以及纽约地铁探索引入AI技术等科技新闻。

关键观点总结

关键观点1: DeepSeek发布Prover-V2模型

DeepSeek于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型,使用了更高效的safetensors文件格式,支持多种计算精度,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。

关键观点2: 小米开源「Xiaomi MiMo」大模型

小米大模型团队宣布开源首个「为推理而生」的大模型Xiaomi MiMo,通过数据和算法等多层面的创新驱动推理能力的提升,包括预训练、数据、训练和后训练等方面的创新。

关键观点3: 谷歌NotebookLM的音频概览功能新增76种语言支持

谷歌宣布其基于人工智能的笔记和研究助手工具NotebookLM的音频概览功能新增76种语言支持,旨在通过虚拟主持人根据用户上传的文档生成播客,帮助用户以另一种方式理解和消化文档中的信息。

关键观点4: Meta公布财报

Meta公司公布2025财年一季度财报,营收达423.14亿美元,同比增长16%;净利润166.44亿美元,同比增长35%。Meta在财报中交出了一份亮眼的成绩单。

关键观点5: 其他科技公司动态

包括微软第三季度营收、苹果在印度布局、宁德时代港股上市、饿了么百亿补贴、英伟达新工具开放使用、Meta第三代雷朋联名智能眼镜发布、荣耀手表全新系列以及纽约地铁探索引入AI技术等科技新闻。


文章预览

DeepSeek 发布 Prover-V2 模型,参数量达 6710 亿 4 月 30 日消息,DeepSeek 于 AI 开源社区 Hugging Face 上发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。 据悉,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达 6710 亿,或为去年发布的 Prover-V1.5 数学模型升级版本。在模型架构上,该模型使用了 DeepSeek-V3 架构,采用 MoE(混合专家)模式,具有 61 层 Transformer 层,7168 维隐藏层。同时支持超长上下文,最大位置嵌入达 16.38 万,使其能处理复杂的数学证明,并且采用了 FP8 量化,可通过量化技术减小模型大小,提高推理效率。(来源:新浪科技) 小米开源「Xiaomi MiMo」大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini 4 月 30 日消息,小米大模型团队通过「Xiaomi MiMo」公众号宣布,小米开源首 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览