GPT-4o 引爆小红书打卡潮，推动 Vision Pro想象，刷新微软、Adobe 产品线

AI科技评论 · 公众号 · · 2024-05-31 12:46

文章预览

GPT-4o 多模态视觉能力激发多重想象。作者丨许一扬编辑丨陈彩娴 1 小红书打卡潮 GPT-4o 发布以后，虽然业内一片嘘声，小红书上却掀起了一股打卡热潮。社交媒体小红书上，多个贴文以及下面的评论区争相考验 GPT-4o 的“眼力”。 Cr. 阿遥（小红书ID: 958377307）左右滑动查看更多相比 Gemini 等一众多模态 AI 模型，GPT-4o 的输出难以置信的准确，超半数情况下 zero-shot 直接命中，附线索提示的 few-shot 则基本上全部命中。而其余国外厂商的多模态大模型错误率较高。值得注意的是，GPT-4o 的识别结果也并不稳定，且较容易受到提示语的影响。特别是使用中文进行提问，GPT-4o 倾向于先猜测东南亚地点，经提示以后才能命中答案。 GPT-4o 一次性命中，Gemini 1.5 Pro 识别失败，GPT-4o 中文 few-shot 命中（Cr. 小红书“鼠拨土和她的CEO朋友们”）左右滑动查看更多相 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博