python win32com读取doc文件内容乱码
内容大概是这样,要怎么解决,或者推荐一个python好用的读取doc文件的库也可以
from docx import Documentimport win32com.client as wc
word = wc.Dispatch("Word.Application")
doc = word.Documents.Open(r"D:\文件\pythonProject\海运出口货物代运委托单1902 - 副本 - 副本.doc")
for para in doc.paragraphs:
print(para.Range.text)
doc.SaveAs(r"D:\文件\pythonProject\订舱委托书2103.pdf", 16)#转换后的文件,12代表转换后为docx文件
doc.Close()
word.Quit()
# document = Document("订舱委托书2103.docx")
#
# for paragraph in document.paragraphs:
# print(paragraph.text)
回答:
python-docx
以上是 python win32com读取doc文件内容乱码 的全部内容, 来源链接: utcz.com/a/159287.html