专栏名称: CV技术指南
长期更新:深度学习、计算机视觉相关技术的总结;图像处理相关知识;最新论文;经典论文;论文综述、tensorflow和pytorch等内容总结。涉及领域 :神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。
目录
今天看啥  ›  专栏  ›  CV技术指南

GPT-4 Turbo首次被击败!国产大模型拿下总分第一

CV技术指南  · 公众号  · 科技自媒体  · 2024-05-24 09:10
    

主要观点总结

本文主要介绍了商汤科技的大模型选手在SuperCLUE测评中的表现,其日日新5.0版本在文科和理科上取得了国内大模型最好成绩。文章还介绍了商汤科技的大模型技术细节,包括数据使用、训练策略、三层架构等。此外,本文还涉及大模型测评的质疑和商汤对此的看法,以及商汤在移动端的技术创新和论文指导班的信息。

关键观点总结

关键观点1: 商汤科技的大模型选手在SuperCLUE测评中取得好成绩

商汤科技的大模型选手日日新5.0在SuperCLUE测评中表现出色,总分超过GPT-4 Turbo,获得国内大模型第一。在文科和理科的细分评测中,也取得了优异的成绩。

关键观点2: 商汤科技的大模型技术细节

商汤科技在训练大模型时采用了MoE架构、超过10T的tokens数据、推理上下文窗口达到200K等技术。还通过知识、推理、执行的三层架构来构建高质量数据。

关键观点3: 大模型测评的质疑和商汤的看法

商汤科技认为大模型测评是帮助用户和研究者了解不同模型性能、推动模型发展的关键。同时,他们强调不应只依赖单一数据集进行评测,而应通过多个评测集和第三方闭卷考试等方式相互印证。

关键观点4: 商汤在移动端的技术创新

商汤科技将眼光放在提供更深的端到端产品价值上,特别是在移动端上。他们通过端云协同实现更优的计算成本,但不损害模型的综合能力。

关键观点5: 论文指导班的信息

论文指导班面向需要升学申博的朋友,提供论文指导服务。指导老师具有深厚的学术和工业背景,涉及范围广泛。报名请扫描二维码了解详细情况。


文章预览

前言   OpenAI长期霸榜的SuperCLUE(中文大模型测评基准),终于被国产大模型反将一军。 Pytorch训练营,花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班 全面上线!! 来源:量子位 仅用于学术分享,若侵权请联系删除 自打SuperCLUE问世以来,成绩第一的选手基本上要么是GPT-4,要么是 GPT-4 Turbo ,来感受一下这个feel: (PS:共有6次成绩,分别为2023年的9月-12月和2024年的2月、4月。) △ 图源:SuperCLUE官方 但就在最近,随着一位国产选手申请的出战,这一局面终是迎来了变数。 SuperCLUE团队对其进行了一番全方位的综合性测评,最终官宣的成绩是: 总分 80.03分 ,超过GPT-4 Turbo的79.13分, 成绩第一 ! △ 图源:SuperCLUE官方公众号 而这位国产大模型选手,正是来自 商汤科技 的 日日新5.0 ( Sens ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览
推荐文章