文章预览
📖 在线文档 [1] | 🛠️ 安装 [2] | 🖥️ 网页版 [3] | 🛀🏻 在线Demo [4] | 💬 交流群 [5] Pix2Text (P2T) [6] 识别图片中文字和数学公式,输出对应的文本和 Latex 表达式;其目标是成为 Mathpix [7] 的免费开源 Python 替代工具。Pix2Text V1.1 整合了版面分析和表格识别模型,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。 Pix2Text V1.0 于 2024 年 2月发布,带来了精度更高的全新公式识别模型(MFR)。 📌 V1.0 具体说明 : Pix2Text V1.0 新版发布,带来了最好的开源数学公式识别模型 [8] 。 而 Pix2Text V1.1 则带来了 完整的版面恢复能力 ,它可以把扫描件的 PDF 直接转换成 Markdown 格式,利用外部工具
………………………………