百川智能超千亿大模型Baichuan 3:中文评测超越GPT-4，医疗能力逼近GPT-4

IPO早知道 · 公众号 · 科技创业 · 2024-01-30 09:17

亦在多个评测中被认为是中文医疗任务表现最佳的大模型。本文为IPO早知道原创作者｜Stone Jin微信公众号｜ipozaozhidao 据IPO早知道消息，百川智能日前发布超千亿参数的大语言模型Baichuan 3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan 3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色，证明了Baichuan 3在自然语言处理和代码生成领域的强大实力。此外，与百亿、几百亿级别参数模型训练不同，超千亿参数模型在训练过程中对高质量数据，训练稳定性、训练效率的要求都高出几个量级。为更好解决相关问题，百川智能在训练过程中针对性地提出了“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等多种创新技术手段及方案，有效提升了Baicuan 3的各项能力。从 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博