注册
登录
专栏名称:
老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
我也要提交微信公众号
今天看啥
公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词RSS订阅方法
知网期刊RSS订阅方法
即刻RSS订阅方法
目录
相关文章推荐
太格有物
·
泗安里太格户外节|80+生活方式品牌介绍,5 ...
·
2 天前
今天看啥
›
专栏
›
老刘说NLP
端到端OCR方案-SmolDocling我们应该关注什么?兼看AI搜索可信度简单评测项目
老刘说NLP
·
公众号
· · 2025-03-18 11:30
文章预览
今天是2025年3月18日,星期二,北京,天气晴。 我们今天来回到 AI搜索和文档解析 这块的工作。 一个是,AI搜索进展,哥伦比亚大学最新研究显示,AI搜索错误率高达60%,这个结论倒不奇怪, 结论依赖于实验条件,我们把这个结论是怎么得出来的做个解释,这个对于评测是有价值的 。 另一个是SmolDocling的小参数量训练及DocTags设计思路,多模态大模型这个方面,最近一段时间,先后出现了 omlocr,mistralocr和smalldocling-256M 的工作,这三者都是一类技术范式,不值得大吹特吹为最强OCR ,实在是混淆视听 。 在一些评测榜单中的表现,很多也都是集中于英文文档,是拟合的结果,对于中文文档,表现并不会很好 。 但是,各类多模态方案,其核心点,其实还是对文档图像模型的特征建模,或者 训练数据构造上的差异 ,这个是跟任务强相关,所以, 我们来看 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
太格有物
·
泗安里太格户外节|80+生活方式品牌介绍,5.16-5.18三天乌托邦
2 天前
李正高
·
如何提升开会发言时的思路清晰度?
6 月前
奥一新闻
·
罗湖一路段被指整改一年仍管养缺位,违规收费屡禁不止!官方回应
4 月前
宝马客
·
【今日毒药】如果生活把你抛入最低谷,也一定给你...
3 月前