看啥推荐读物
专栏名称: 第一财经YiMagazine
这里是《第一财经周刊》读者俱乐部,我们为你发掘精彩的商业价值,也邀请你一起探寻明亮的商业世界。
今天看啥  ›  专栏  ›  第一财经YiMagazine

智能周报|今夏大模型之战:真正的推理能力

第一财经YiMagazine  · 公众号  · 财经  · 2024-04-14 22:48
撰文 | 新皮层小组编辑 | 吴洋洋基于生成式AI(GenAI)开发的商业化产品越来越多。本周,Google考虑对基于AI的搜索服务收费、TikTok将推出AI虚拟主播的消息先后传出,有着「全球首款AI原生硬件」之称的AI Pin也于本周开始发售,售价699美元。与上一代用基于规则的算法开发出来的菜单式应用相比,这些新产品都开辟了新的交互方式,让用户可以通过直接与AI对话获得服务。不过,这些GenAI原生应用的商业化进度比预想中来得慢,一大原因仍然是模型能力的局限。模型测评机构Vals.AI的测试结果表明,在从各种维度展开测试的榜单中,GPT-4的排名依然不是第一就是第二,仅在部分情况下Anthropic的最新最大size模型Claude 3 Opus会超过它。也就是说,GPT-4这个发布于一年前的模型仍然是目前全球最「聪明」的。这种状况对OpenAI算是好事,但对整个行业来说则相反 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照