看啥推荐读物
专栏名称: 商汤科技SenseTime
商汤科技是国家科技部授予的“智能视觉”人工智能开放创新平台,以“坚持原创,让AI引领人类进步”为使命和愿景,建立并打造全球领先的深度学习平台和超算中心,并研发一系列AI技术。关注商汤科技SenseTime,与我们一同拥抱AI大时代。
今天看啥  ›  专栏  ›  商汤科技SenseTime

中国首个GPT-4 Turbo级别的大模型登场,6000亿参数,商汤「日日新5.0」发布

商汤科技SenseTime  · 公众号  ·  · 2024-04-24 21:44
国产AI大模型迎来对标全球顶尖版本时刻!4月23日,商汤科技带来全新升级的「日日新SenseNova 5.0」大模型,具备更强的知识、数学、推理及代码能力,综合性能全面对标 GPT-4 Turbo,并在主流客观评测上达到或超越 GPT-4 Turbo。「日日新 5.0」能力提升主要得益三个方面:采用混合专家架构(MoE),激活少量参数就能完成推理。且推理时上下文窗口达到 200K 左右。基于超过10TB tokens训练、覆盖数千亿量级的逻辑型合成思维链数据。商汤AI大装置SenseCore算力设施与算法设计的联合调优。先看看BenchMark成绩:「日日新 5.0」在大部分核心测试集指标上都对标甚至超过GPT-4 Turbo在实际使用中,「日日新 5.0」具体表现怎么样?下面,分别从自然语言能力、文生图能力、多模态和数据分析能力几个方面对比一下。▎自然语言能力「日日新 5.0」的自然语言能力得益于对 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照