看啥推荐读物
专栏名称: AirPython
分享 Python 自动化及爬虫、数据分析实战干货,欢迎关注。
目录
相关文章推荐
今天看啥  ›  专栏  ›  AirPython

Python 操作 PDF,这两个库必须会!

AirPython  · 公众号  ·  · 2021-02-02 12:03
Python在自动化办公方面有很多实用的第三方库,可以很方便的处理word、excel、ppt、pdf文件今天我们就学习一下Python处理PDF文档的两个常用库「pdfplumber」、「pypdf2」pdfplumber库按页处理 pdf ,获取页面文字,提取表格等操作文档:https://github.com/jsvine/pdfplumberPyPDF2 是一个纯 Python PDF 库,可以读取文档信息(标题,作者等)、写入、分割、合并PDF文档,它还可以对pdf文档进行添加水印、加密解密等文档:https://pythonhosted.org/PyPDF2安装:pip install pypdf2pip install pdfplumberpdfplumber提取PDF文字「提取单页pdf文字」# 提取pdf文字import pdfplumberwith pdfplumber.open("D:\\pdffiles\\Python编码规范中文版.pdf") as pdf:    page01 = pdf.pages[0] #指定页码    text = page01.extract_text()#提取文本    print(text) ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照