看啥推荐读物
专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥  ›  专栏  ›  宝玉xp

GPT-4V 的OCR并不怎么好,中文更差,Gemini OCR-20240509093021

宝玉xp  · 微博  · AI  · 2024-05-09 09:30
2024-05-09 09:30 本条微博链接 GPT-4V 的OCR并不怎么好,中文更差,Gemini OCR最强,因为是专门的OCR工具,但模型能力稍弱。最好的组合(稍微麻烦一点)是Gemini或者专业OCR识别文本,再将文本提交给GPT-4处理 花了二十美元重金升级ChatGPT 4.0,让它识别图像里的文字,是一封晚清时期的政府文件。然后它夸夸夸出来了一堆:感时花溅泪,恨 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照