国产黑马与GPT-4o称霸中文榜首！Yi-Large勇夺国内LLM盲测桂冠，冲进世界第七

机器学习研究组订阅 · 公众号 · AI · 2024-05-21 20:31

文章预览

几周前，一个名为「im-also-a-good-gpt2-chatbot」的神秘模型突然现身大模型竞技场Chatbot Arena，排名直接超过GPT-4-Turbo、Gemini 1.5 Pro、Claude 3 Opus、Llama 3-70B等各家国际大厂的当家基座模型。随后OpenAI揭开了「im-also-a-good-gpt2-chatbot」神秘面纱——正是GPT-4o的测试版本。 OpenAI CEO Sam Altman也在GPT-4o发布后亲自转帖引用LMSYS Arena盲测擂台的测试结果。由开放研究组织LMSYS Org（Large Model Systems Organization）发布的Chatbot Arena已经成为OpenAI、Anthropic、Google、Meta等国际大厂「龙争虎斗」的当红擂台，以最开放与科学的评测方法，在大模型进入第二年之际开放群众投票。时隔一周，在最新更新的排名中，类「im-also-a-good-gpt2-chatbot」的黑马故事再次上。这次排名飞速上涨的模型正是由中国大模型公司零一万物提交的「Yi-Large」千亿参数闭源大模型。在LMSYS竞技场最新排名中， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【[165星]mcp-on-vercel：在Vercel上运行M-20250504173500

14 小时前

爱可可-爱生活 · 【[60星]Awesome-Efficient-Inferenc-20250503141955

昨天

机器学习研究组订阅 · 全球首个AI科学家天团出道！007做实验碾压人类博士，生化环材圈巨震

2 天前

爱可可-爱生活 · 【[872星]Colanode：开源本地优先的协作工具，让你掌控-20250502122438

2 天前

宝玉xp · 回复@我是永泽:我这是逆向的原始的内置的未公开的系统提示词，和c-20250502015707

3 天前

江西宣传 · 夜读丨吃1次等于“熬夜7天”？保护甲状腺，3种早餐千万少吃！

2 月前

人物 · 女孩们，欢迎来到赛场中央

1 月前

新闻晨报 · “啥话没说把帐篷全掀翻了！”博主控诉被粗暴对待，网友：到底是谁粗暴对待谁

2 周前