专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
目录
今天看啥  ›  专栏  ›  AI前线

华为盘古大模型开源,推理方案、基础代码全公开!

AI前线  · 公众号  · AI  · 2025-06-30 13:00
    

主要观点总结

华为今日宣布开源盘古70亿参数稠密模型、盘古Pro MoE 720亿参数混合专家模型和基于昇腾的模型推理技术。此举旨在推动大模型技术的研究与创新发展,加速人工智能在各行各业的应用与价值创造。华为还介绍了盘古Pro MoE模型的特点和优势,包括其分组混合专家模型架构、以较低计算成本支持更大规模参数的优势,以及针对昇腾硬件的系统优化。此外,华为还公开了相关开源代码的昇腾超大规模MoE模型推理部署方案,包括多个核心技术的介绍。同时,针对大语言模型的推理挑战,华为提出了盘古Embedded高效大语言模型推理器,具备快慢思考能力的双系统框架等。

关键观点总结

关键观点1: 华为开源盘古系列模型和基于昇腾的模型推理技术

这是华为推动大模型技术研究与创新发展的重要举措,旨在加速人工智能在各行各业的应用与价值创造。

关键观点2: 盘古Pro MoE模型的特点和优势

包括其分组混合专家模型架构、以较低计算成本支持更大规模参数的优势,以及针对昇腾硬件的系统优化。

关键观点3: 昇腾超大规模MoE模型推理部署方案

华为公开了相关开源代码,包括多个核心技术,如OmniPlacement高效负载均衡算法、投机推理框架FusionSpec等。

关键观点4: 盘古Embedded高效大语言模型推理器

华为提出了具备快慢思考能力的双系统框架,以及通过创新的两阶段训练框架构建此模型的方法。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照