专栏名称: AIGC开发者
致力于成为国内最好的Python开发者学习交流平台,这里有关于Python的国内外最新消息,每日推送有趣有料的技术干货和社区动态。 官方网站:www.python-cn.com
今天看啥  ›  专栏  ›  AIGC开发者

用OpenCV和OCR识别图片中的表格数据

AIGC开发者  · 公众号  · Python  · 2019-03-24 21:00
♚作者: jclian,喜欢算法,热爱分享,希望能结交更多志同道合的朋友,一起在学习Python的道路上走得更远!  在很多时候,我们的数据来源形式是多种多样的,有时候数据(或表格)也会呈现在图片中。那么,我们如何来获取图片中的有用数据呢?当一张图片中含有表格数据的时候,我们可以用OpenCV识别表格中的直线,然后再用OCR技术识别其中的文字。  本文仅作为如何识别图片中的表格的一个例子,希望能给读者一些启示。笔者用到的工具如下:opencvpyteressactnumpy我们用opencv来识别表格中的直线,用pyteressact来识别单元格文字,用numpy做数值处理。我们要识别的示例图片(AI.png)如下:示例图片 AI.png我们分以下几步进行识别:识别表格中的横线,即分割记录( ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照