专栏名称: arXiv每日学术速递
跟踪计算机视觉、人工智能、机器学习、NLP、语音识别、量化金融等热门方向学术信息
目录
今天看啥  ›  专栏  ›  arXiv每日学术速递

GPT-4o 引爆小红书打卡潮,推动 Vision Pro想象,刷新微软、Adobe 产品线

arXiv每日学术速递  · 公众号  ·  · 2024-05-31 13:51
    

文章预览

GPT-4o 多模态视觉能力激发多重想象。 作者丨许一扬 编辑丨陈彩娴 1 小红书打卡潮 GPT-4o 发布以后,虽然业内一片嘘声,小红书上却掀起了一股打卡热潮。社交媒体小红书上,多个贴文以及下面的评论区争相考验 GPT-4o 的“眼力”。 Cr. 阿遥(小红书ID: 958377307) 左右滑动查看更多 相比 Gemini 等一众多模态 AI 模型,GPT-4o 的输出难以置信的准确,超半数情况下 zero-shot 直接命中,附线索提示的 few-shot 则基本上全部命中。 而其余国外厂商的多模态大模型错误率较高。 值得注意的是,GPT-4o 的识别结果也并不稳定,且较容易受到提示语的影响。特别是使用中文进行提问,GPT-4o 倾向于先猜测东南亚地点,经提示以后才能命中答案。 GPT-4o 一次性命中,Gemini 1.5 Pro 识别失败,GPT-4o 中文 few-shot 命中(Cr. 小红书“鼠拨土和她的CEO朋友们”) 左右滑动查看更多 相 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览