Python之pdf内容读取

2023-11-19

import pandas as pd
import pdfplumber

with pdfplumber.open(r'C:\Users\2023\02\开发.pdf') as pdf:
    for page in pdf.pages:
        #输出文本内容,类型为STR
        print(type(page.extract_text()))
        #获取表格
        tables=page.extract_tables()
        tables_n=len(tables)
        for ind in range(tables_n):
            #表格第一行为标题,类型为pandas.core.frame.DataFrame转换为list
            print(pd.DataFrame(tables[ind][1:],columns=tables[ind][0]).values.tolist())
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python之pdf内容读取 的相关文章

随机推荐