文章预览
GPT-4o 多模态视觉能力激发多重想象。 作者丨许一扬 编辑丨陈彩娴 1 小红书打卡潮 GPT-4o 发布以后,虽然业内一片嘘声,小红书上却掀起了一股打卡热潮。社交媒体小红书上,多个贴文以及下面的评论区争相考验 GPT-4o 的“眼力”。 Cr. 阿遥(小红书ID: 958377307) 左右滑动查看更多 相比 Gemini 等一众多模态 AI 模型,GPT-4o 的输出难以置信的准确,超半数情况下 zero-shot 直接命中,附线索提示的 few-shot 则基本上全部命中。 而其余国外厂商的多模态大模型错误率较高。 值得注意的是,GPT-4o 的识别结果也并不稳定,且较容易受到提示语的影响。特别是使用中文进行提问,GPT-4o 倾向于先猜测东南亚地点,经提示以后才能命中答案。 GPT-4o 一次性命中,Gemini 1.5 Pro 识别失败,GPT-4o 中文 few-shot 命中(Cr. 小红书“鼠拨土和她的CEO朋友们”) 左右滑动查看更多 相
………………………………