今天看啥  ›  专栏  ›  IPO早知道

百川智能超千亿大模型Baichuan 3:中文评测超越GPT-4,医疗能力逼近GPT-4

IPO早知道  · 公众号  · 科技创业  · 2024-01-30 09:17
亦在多个评测中被认为是中文医疗任务表现最佳的大模型。本文为IPO早知道原创作者|Stone Jin微信公众号|ipozaozhidao  据IPO早知道消息,百川智能日前发布超千亿参数的大语言模型Baichuan 3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色,证明了Baichuan 3在自然语言处理和代码生成领域的强大实力。此外,与百亿、几百亿级别参数模型训练不同,超千亿参数模型在训练过程中对高质量数据,训练稳定性、训练效率的要求都高出几个量级。为更好解决相关问题,百川智能在训练过程中针对性地提出了“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等多种创新技术手段及方案,有效提升了Baicuan 3的各项能力。从 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照