专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

网页链接一个高质量PDF内容提取工具:PDF-Extract-K-20240715101749

斌叔OKmath  · 微博  ·  · 2024-07-15 10:17
    

文章预览

2024-07-15 10:17 本条微博链接 网页链接 一个高质量PDF内容提取工具:PDF-Extract-Kit PDF-Extract-Kit通过集成多个模型实现了PDF高质量提取,适用于学术论文、教科书、研究报告和财务报表等多种文档类型,在扫描模糊或有水印的情况下也能保持高鲁棒性 1、布局检测采用LayoutLMv3模型进行区域检测,包括图像、表格、标题、文本等 2、公式检测上采用YOLOv8,包含行内公式和行间公式 3、公式识别上采用UniMERNet识别 4、光学字符识别 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览