python PDF转docx库的安装与使用

python PDF转docx库的安装与使用

下载

anaconda中直接通过anaconda prompt下载pdf2docx库

pip install pdf2docx

在conda环境中下载pdf2docx库

使用(三种方法)

  1. 可以直接通过命令行使用 ,参考介绍文档即可:
    pdf2docx官方使用手册

  2. 或图形用户界面;
    直接在环境中启动GUI即可:

$ pdf2docx gui

GUI界面

  1. 不习惯用命令行转化,也可以在pycharm中用安装了pdf2docx的环境运行实现
from pdf2docx import Converter

#修改成自己需要转化和保存的路径即可
pdf_file = 'E:/test_pdf2docx/pdf/Granded Language Model Reasoning Through Simulation.pdf'
docx_file = 'E:/test_pdf2docx/docx/Granded Language Model Reasoning Through Simulation.docx'
docx_file_1 = 'E:/test_pdf2docx/docx/test1.docx'
docx_file_2 = 'E:/test_pdf2docx/docx/test2.docx'
docx_file_4 = 'E:/test_pdf2docx/docx/test3.docx'
pdf_file_3 = 'E:/test_pdf2docx/pdf/深度强化学习(中文版-彩色压缩).pdf'
docx_file_3 = 'E:/test_pdf2docx/docx/中文转换测试.docx'

cv = Converter(pdf_file)
#转换所有页面
cv.convert(docx_file)
cv.close()

#转换指定页面
cv.convert(docx_file_3, start=1, end=11) #从第2页开始转换,转换至第11页
cv.close()

效果

中文英文转化效果都可以
英文转化效果图


版权声明:本文为xin_yue12138原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。