看啥推荐读物
专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

CVPR 2024|OmniParser:统一图文解析模型:文字检测识别、视觉信息抽取和表格识别

极市平台  · 公众号  ·  · 2024-04-18 19:11
↑ 点击蓝字 关注极市平台作者丨万建强来源丨CSIG文档图像分析与识别专委会编辑丨极市平台极市导读 本文提出了一种面向文字图像的统一解析框架,将OCR多个核心任务进行了形式上的统一,同时展现出对于其他OCR任务如层次化文字检测的泛化能力,对于开发OCR领域的统一大模型又近了一步。 >>加入极市CV技术交流群,走在计算机视觉的最前沿本文简要介绍CVPR 2024录用论文“OmniParser: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition”的主要工作。这篇文章提出了一个新的统一框架,将文字领域的核心任务(文字检测识别,关键信息抽取和表格识别)巧妙融合在一起,无需额外的任务相关的定制化模块设计。一、研究背景随着深度学习的快速发展,模型可用训练数据规模呈指数级上升,大规模语言模型[1]和多模态模型[2]的通用理 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照