专栏名称: CV技术指南

长期更新：深度学习、计算机视觉相关技术的总结；图像处理相关知识；最新论文；经典论文；论文综述、tensorflow和pytorch等内容总结。涉及领域：神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

GPT-4 Turbo首次被击败！国产大模型拿下总分第一

CV技术指南 · 公众号 · 科技自媒体 · 2024-05-24 09:10

主要观点总结

本文主要介绍了商汤科技的大模型选手在SuperCLUE测评中的表现，其日日新5.0版本在文科和理科上取得了国内大模型最好成绩。文章还介绍了商汤科技的大模型技术细节，包括数据使用、训练策略、三层架构等。此外，本文还涉及大模型测评的质疑和商汤对此的看法，以及商汤在移动端的技术创新和论文指导班的信息。

关键观点总结

关键观点1: 商汤科技的大模型选手在SuperCLUE测评中取得好成绩

商汤科技的大模型选手日日新5.0在SuperCLUE测评中表现出色，总分超过GPT-4 Turbo，获得国内大模型第一。在文科和理科的细分评测中，也取得了优异的成绩。

关键观点2: 商汤科技的大模型技术细节

商汤科技在训练大模型时采用了MoE架构、超过10T的tokens数据、推理上下文窗口达到200K等技术。还通过知识、推理、执行的三层架构来构建高质量数据。

关键观点3: 大模型测评的质疑和商汤的看法

商汤科技认为大模型测评是帮助用户和研究者了解不同模型性能、推动模型发展的关键。同时，他们强调不应只依赖单一数据集进行评测，而应通过多个评测集和第三方闭卷考试等方式相互印证。

关键观点4: 商汤在移动端的技术创新

商汤科技将眼光放在提供更深的端到端产品价值上，特别是在移动端上。他们通过端云协同实现更优的计算成本，但不损害模型的综合能力。

关键观点5: 论文指导班的信息

论文指导班面向需要升学申博的朋友，提供论文指导服务。指导老师具有深厚的学术和工业背景，涉及范围广泛。报名请扫描二维码了解详细情况。

文章预览

前言 OpenAI长期霸榜的SuperCLUE（中文大模型测评基准），终于被国产大模型反将一军。 Pytorch训练营，花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班全面上线!! 来源：量子位仅用于学术分享，若侵权请联系删除自打SuperCLUE问世以来，成绩第一的选手基本上要么是GPT-4，要么是 GPT-4 Turbo ，来感受一下这个feel：（PS：共有6次成绩，分别为2023年的9月-12月和2024年的2月、4月。） △ 图源：SuperCLUE官方但就在最近，随着一位国产选手申请的出战，这一局面终是迎来了变数。 SuperCLUE团队对其进行了一番全方位的综合性测评，最终官宣的成绩是：总分 80.03分，超过GPT-4 Turbo的79.13分，成绩第一！ △ 图源：SuperCLUE官方公众号而这位国产大模型选手，正是来自商汤科技的日日新5.0 （ Sens ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博