python打开word文件|python如何读取word文件-山九号

㈠ python能打开word文档吗

首先下载安装win32comfrom win32com import client as wcword = wc.Dispatch('Word.Application')doc = word.Documents.Open('c:/test')doc.SaveAs('c:/test.text', 2)doc.Close()word.Quit()这种方式产生的text文档，不能用python用普通的r方式读取，为了让python可以用r方式读取，应当写成doc.SaveAs('c:/test', 4)注意：系统执行完成后，会自动产生文件后缀txt（虽然没有指明后缀）。在xp系统下面，应当，open(r'c:\text','r')wdFormatDocument = 0wdFormatDocument97 = 0wdFormatDocumentDefault = 16wdFormatDOSText = 4wdFormatDOSTextLineBreaks = 5wdFormatEncodedText = 7wdFormatFilteredHTML = 10wdFormatFlatXML = 19wdFormatFlatXMLMacroEnabled = 20wdFormatFlatXMLTemplate = 21 = 22wdFormatHTML = 8wdFormatPDF = 17wdFormatRTF = 6wdFormatTemplate = 1wdFormatTemplate97 = 1wdFormatText = 2wdFormatTextLineBreaks = 3wdFormatUnicodeText = 7wdFormatWebArchive = 9wdFormatXML = 11wdFormatXMLDocument = 12 = 13wdFormatXMLTemplate = 14 = 15wdFormatXPS = 18照着字面意思应该能对应到相应的文件格式，如果你是office 2003可能支持不了这么多格式。word文件转html有两种格式可选wdFormatHTML、wdFormatFilteredHTML（对应数字 8、10），区别是如果是wdFormatHTML格式的话，word文件里面的公式等ole对象将会存储成wmf格式，而选用 wdFormatFilteredHTML的话公式图片将存储为gif格式，而且目测可以看出用wdFormatFilteredHTML生成的HTML 明显比wdFormatHTML要干净许多。当然你也可以用任意一种语言通过com来调用office API，比如PHP.from win32com import client as wcword = wc.Dispatch('Word.Application')doc = word.Documents.Open(r'c:/test1.doc')doc.SaveAs('c:/test1.text', 4)doc.Close()import restrings=open(r'c:\test1.text','r').read()result=re.findall('\(\s*[A-D]\s*\)|\(\xa1*[A-D]\xa1*\)|\（\s*[A-D]\s*\）|\（\xa1*[A-D]\xa1*\）',strings)chan=re.sub('\(\s*[A-D]\s*\)|\(\xa1*[A-D]\xa1*\)|\（\s*[A-D]\s*\）|\（\xa1*[A-D]\xa1*\）','()',strings)question=open(r'c:\question','a+')question.write(chan)question.close()answer=open(r'c:\answeronly','a+')for i,a in enumerate(result): m=re.search('[A-D]',a) answer.write(str(i+1)+' '+m.group()+'\n')answer.close()chan=re.sub(r'\xa3\xa8\s*[A-D]\s*\xa3\xa9','()',strings)#不要()，容易引起歧义。

㈡ python如何读取word文件

>>>defPrintAllParagraphs(doc):count=doc.Paragraphs.Countforiinrange(count-1,-1,-1):pr=doc.Paragraphs[i].Rangeprintpr.Text>>>app=my.Office.Word.GetInstance()>>>doc=app.Documents[0]>>>PrintAllParagraphs(doc)1.什么是域域应用基础>>>@staticmethoddefGetInstance():u'''获取Word应用程序的Application对象'''importwin32com.clientreturnwin32com.client.Dispatch('Word.Application')

my.Office.Word.GetInstance的方法实现如上，是一个使用win32com操纵Word Com的接口的封装

所有Paragraph即段落对象，都是通过Paragraph.Range.Text来访问它的文字的

㈢ python操作word文档表格

>>>app=my.Office.Word.GetInstance()>>>doc=app.Documents[0]>>>printdoc.NameVBA工具集.doc>>>doc.Tables.Count2>>>table=doc.Tables[1]>>>table.Cell(1,1).Select()>>>app.Selection.MoveEnd(Unit=12,Count=4)4>>>app.Selection.Cells.Shading.Texture=-10>>>

1.my.Office.Word.GetInstance()用win32com得到Word的Application对象的实例

2.我所使用的样本word文件中包含两个Table第二个Table是想要修改的

3.table.Cell(1,1).Select()用于选中这个样表的第一个单元格

4.app.Selection.MoveEnd用于获得向右多选取4个单元格，wdCell=12，用于指示按单元格移动

5.app.Selection.Cells.Shading.Texture = -10用于执行阴影底纹的设置工作，wdTextureDiagonalUp=-10是一个代表斜向右上的底纹样式的常数

㈣ python如何读取word文件中的文本内容并写入到新的txt文件

㈤ python操作word,关于win32com

word中doc这个格式的文件是微软特有格式，微软没有向外公开任何的api接口文档，只能通过微软提供的OLE组件来提其COM接口，只要你的机器上安装了Offices完整的办公软件，在安装目录下面有个MSWORD.OLB组件，导入这个即可。

㈥ word图片和文字文混排内容怎么用python读取写入

Python可以利用python-docx模块处理word文档，处理方式是面向对象的。也就是说python-docx模块会把word文档，文档中的段落、文本、字体等都看做对象，对对象进行处理就是对word文档的内容处理。二，相关概念如果需要读取word文档中的文字（一般来说，程序也只需要认识word文档中的文字信息），需要先了解python-docx模块的几个概念。1，Document对象，表示一个word文档。2，Paragraph对象，表示word文档中的一个段落3，Paragraph对象的text属性，表示段落中的文本内容。三，模块的安装和导入需要注意，python-docx模块安装需要在cmd命令行中输入pip install python-docx，如下图表示安装成功（最后那句英文Successfully installed，成功地安装完成，十分考验英文水平。）注意在导入模块时，用的是import docx。也真是奇了怪了，怎么安装和导入模块时，很多都不用一个名字，看来是很有必要出一个python版本的模块管理程序python-maven了，本段纯属PS。四，读取word文本在了解了上面的信息之后，就很简单了，下面先创建一个D:\temp\word.docx文件，并在其中输入如下内容。然后写一段程序，代码及输出结果如下：#读取docx中的文本代码示例import docx#获取文档对象file=docx.Document("D:\\temp\\word.docx")print("段落数:"+str(len(file.paragraphs)))#段落数为13，每个回车隔离一段#输出每一段的内容for para in file.paragraphs: print(para.text)#输出段落编号及段落内容for i in range(len(file.paragraphs)): print("第"+str(i)+"段的内容是："+file.paragraphs[i].text)运行结果：================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================段落数:13啊我看见一座山雄伟的大山真高啊啊这座山是！真的很高！第0段的内容是：啊第1段的内容是：第2段的内容是：我看见一座山第3段的内容是：第4段的内容是：雄伟的大山第5段的内容是：第6段的内容是：真高啊第7段的内容是：第8段的内容是：啊第9段的内容是：第10段的内容是：这座山是！第11段的内容是：第12段的内容是：真的很高！>>> 总结以上就是本文关于Python读取word文本操作详解的全部内容，希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题，如有不足之处，欢迎留言指出。感谢朋友们对本站的支持！

㈦如何在 Linux 上使用 Python 读取 word 文件信息

必须说明：不同于Illustrator、InDesign、CorelDRAW、OpenOffice DRAW、Incscape等工具，Word是流动分页的，文件内容本身并不存储分页结果。具体分页时断在哪里、最后分出多少页，都需要现场渲染所有的图文内容之后才能确定。

（简而言之就是：Word文件中仅包含了一行一行的文本，与页面设置中指定的页面尺寸。Word每次打开文件时都会一行一行“摆放”文本数据，发现一页装不下了自动新开一页。当然真正的Word渲染引擎肯定有更复杂的行为。）

从.doc/.docx文件中直接读出页面数量，这本身就是个伪命题。所以千万别在“直接读取页面数量”这个方向上寻求方案——软件开发的技法不好可以改正，但路线错了必死无疑！

你需要调动一套能够真的把Word文件的内容渲染出来的工具（支持二次开发的）。只有把Word文件的所有内容渲染成为可以观看的图形，才能准确得知页面的总数。在Linux上很可能LibreOffice可以吧。而在Windows上就当然是用Word本身了。

注意Word的分页结论是没有保证的。缺少字体、字形不同、软件环境不同等各种原因，都会造成不同电脑上打开同一个Word文件的页数不一致。这一点对服务器也没有例外。得到了页数也只能参考使用，而不要100%信赖。

㈧ python 不能read word文件

WORD文件有专门的格式，你当然不可能像文本文件一样读写，你这样打开只能看到一堆乱码。Python本身没有这个功能，修改WORD文件的话Windows有专门的API，在Office开发套件里面，你用Python调用相关的库才能实现你想要的功能。

㈨我想用Python操作word，网上看了些代码，但自己的老是报错，求高手看看！！！

看了一下应该是没有自动创建constants变量，constants是空的先运行语句：win32com.client.gencache.EnsureDispatch('Word.Application')应该就可以了或者运行pythonwin菜单栏选择Tools——>Com MakePy Utility然后在弹出的窗口中选择Microsoft Word x.y Object Library 点击OK就可以了或者直接运行client文件夹下的makepy.py文件同样选择Microsoft Word 也可以

㈩ python3读取word文件到sqlite

大象关进冰箱需要两步走：

获取word文件内容将获取的内容拆分为对应的业务字段并写入sqlite中

首先我这有个文档，里面包含了驾照考试科四试题。

未经允许不得转载：山九号 » python打开word文件|python如何读取word文件

python打开word文件|python如何读取word文件

㈠ python能打开word文档吗

㈡ python如何读取word文件

㈢ python操作word文档表格

㈣ python如何读取word文件中的文本内容并写入到新的txt文件

㈤ python操作word,关于win32com

㈥ word图片和文字文混排内容怎么用python读取写入

㈦如何在 Linux 上使用 Python 读取 word 文件信息

㈧ python 不能read word文件

㈨我想用Python操作word，网上看了些代码，但自己的老是报错，求高手看看！！！

㈩ python3读取word文件到sqlite

作者：大山

相关推荐

展示

最新文章

㈠ python能打开word文档吗

㈡ python如何读取word文件

㈢ python操作word文档表格

㈣ python如何读取word文件中的文本内容并写入到新的txt文件

㈤ python操作word,关于win32com

㈥ word图片和文字文混排内容怎么用python读取写入

㈦ 如何在 Linux 上使用 Python 读取 word 文件信息

㈧ python 不能read word文件

㈨ 我想用Python操作word，网上看了些代码，但自己的老是报错，求高手看看！！！

㈩ python3读取word文件到sqlite

作者：大山

相关推荐

展示

最新文章

㈦如何在 Linux 上使用 Python 读取 word 文件信息

㈨我想用Python操作word，网上看了些代码，但自己的老是报错，求高手看看！！！