python怎么打开word文件|python如何读取word文件

python怎么打开word文件|python如何读取word文件的第1张示图

A. 如何用python读取excel生成word文档

word文件转html有两种格式可选wdFormatHTML、wdFormatFilteredHTML(对应数字8、10),区别是如果是wdFormatHTML格式的话word文件里面的公式回等ole对象将会存储答成wmf格式,而选用wdFormatFilteredHTML的话公式图片将存储为gif格式,而且目测可以看出用wdFormatFilteredHTML生成的HTML明显比wdFormatHTML要干净许多。

B. python打开本地word文档有问题

看报错信息是说 “123.docx”不是word文件,你先确定下这个文件是合法的word文件?

C. python中如何打开一个文档,在原有基础上继续写

file.open("file.txt",'a')file.write("test line!") 这样你的test line就会写在原来文件的最后面,不会覆盖原来的内容.

D. python open文件操作写入word为啥打不开

Word文件的格式远没有这么简单,你这种直接写入的方式只适用于纯文本文件。

E. python读取word文档内容

import fnmatch, os, sys, win32com.client readpath=r'D:\123' wordapp = win32com.client.gencache.EnsureDispatch("Word.Application") try: for path, dirs, files in os.walk(readpath): for filename in files: if not fnmatch.fnmatch(filename, '*.docx'):continue doc = os.path.abspath(os.path.join(path,filename)) print 'processing %s…' % doc wordapp.Documents.Open(doc) docastext = doc[:-4] + 'txt' wordapp.ActiveDocument.SaveAs(docastext,FileFormat=win32com.client.constants.wdFormatText) wordapp.ActiveDocument.Close() finally: wordapp.Quit() print 'end' f=open(r'd:\123\test.txt','r') for line in f.readlines(): print line.decode('gbk') f.close()

F. python 不能read word文件

WORD文件有专门的格式,你当然不可能像文本文件一样读写,你这样打开只能看到一堆乱码。Python本身没有这个功能,修改WORD文件的话Windows有专门的API,在Office开发套件里面,你用Python调用相关的库才能实现你想要的功能。

G. python如何读取word文件

>>>defPrintAllParagraphs(doc):count=doc.Paragraphs.Countforiinrange(count-1,-1,-1):pr=doc.Paragraphs[i].Rangeprintpr.Text>>>app=my.Office.Word.GetInstance()>>>doc=app.Documents[0]>>>PrintAllParagraphs(doc)1.什么是域域应用基础>>>@staticmethoddefGetInstance():u'''获取Word应用程序的Application对象'''importwin32com.clientreturnwin32com.client.Dispatch('Word.Application')

my.Office.Word.GetInstance的方法实现如上,是一个使用win32com操纵Word Com的接口的封装

所有Paragraph即段落对象,都是通过Paragraph.Range.Text来访问它的文字的

H. 如何在 Linux 上使用 Python 读取 word 文件信息

必须说明:不同于Illustrator、InDesign、CorelDRAW、OpenOffice DRAW、Incscape等工具,Word是流动分页的,文件内容本身并不存储分页结果。具体分页时断在哪里、最后分出多少页,都需要现场渲染所有的图文内容之后才能确定。(简而言之就是:Word文件中仅包含了一行一行的文本,与页面设置中指定的页面尺寸。Word每次打开文件时都会一行一行“摆放”文本数据,发现一页装不下了自动新开一页。当然真正的Word渲染引擎肯定有更复杂的行为。)从.doc/.docx文件中直接读出页面数量,这本身就是个伪命题。所以千万别在“直接读取页面数量”这个方向上寻求方案——软件开发的技法不好可以改正,但路线错了必死无疑!你需要调动一套能够真的把Word文件的内容渲染出来的工具(支持二次开发的)。只有把Word文件的所有内容渲染成为可以观看的图形,才能准确得知页面的总数。在Linux上很可能LibreOffice可以吧。而在Windows上就当然是用Word本身了。注意Word的分页结论是没有保证的。缺少字体、字形不同、软件环境不同等各种原因,都会造成不同电脑上打开同一个Word文件的页数不一致。这一点对服务器也没有例外。得到了页数也只能参考使用,而不要100%信赖。

未经允许不得转载:山九号 » python怎么打开word文件|python如何读取word文件

赞 (0)