提取pdf中的表格到excel或csv中

python学习网 2020-07-14 13:13:11
import  pdfplumber
import  pandas

#将表格写进csv文件
#with pdfplumber.open(r'E:\pdf\表格.pdf')  as f:
    #for  page  in f.pages:
        #for table  in page.extract_tables():
            #data=pandas.DataFrame(table[1:],columns=table[0])
            #data.to_csv(r'E:\pdf\表格.csv',mode='a',encoding="ANSI")

#将表格写进excel中不同的工作表
count=1
with  pdfplumber.open(r'E:\pdf\表格.pdf') as f:
    with pandas.ExcelWriter(r'E:\pdf\多个工作表.xlsx')  as w:  #创建多张工作表
        for  page  in f.pages:
            for table  in  page.extract_tables():
                data=pandas.DataFrame(table[1:],columns=table[0])
                data.to_excel(w,sheet_name='{}.xlsx'.format(count))
                count+=1
                

 

阅读(3537) 评论(0)