【Python学习】办公自动化 |
您所在的位置:网站首页 › 提取pdf中的文字到指定表格怎么弄不了 › 【Python学习】办公自动化 |
实现目标:
使用python批量读取PDF中的表格数据并写入Excel文档 pdf路径:“D:\学习资料\Python\读取PDF\账单” 实现思路:使用os、pdfplumber、openpyxl模块实现 os :用于获取pdf文件 pdfplumber :用于操作pdf文件 openpyxl :用于操作excel文件 实现步骤: 1、获取PDF文件列表首先,要进行文件相关的操作,我们需要使用import导入Python内置的os模块。 接着,将路径作为参数传入os.listdir()函数,就可以获得一个列表,该列表内装有该路径下所有pdf文件名称。 # 使用import导入os模块 import os # 将PDF文件夹路径 D:\学习资料\Python\读取PDF\账单,赋值给变量path path = "D:\学习资料\Python\读取PDF\账单" # 使用os.listdir()函数获取该路径下所有的文件名称,并赋值给变量allItems allItems = os.listdir(path) # 使用print输出文件名称 print(allItems) 2、遍历文件列表,读取PDF文档操作pdf文件,我们要导入pdfplumber模块。 然后,使用for循环遍历allitems列表中所有文件名,使用os.path.join()函数将文件夹路径和文件名合并,获取文件路径并赋值给变量pdfpath,接着在使用pdfplumber.open()函数读取PDF文档内容,赋值给变量pdf。 |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |