❶ python怎么实现文件格式的转换
1. 如果是文档类转换的话, 可以借助 pypandoc模块(pip install pypandoc)
importpypandocout=pypandoc.convert_file('a.txt','docx',outputfile='a.docx')#转为docx
2. 如果是图片或者视频类的转化的话, 可以使用 opencv
importcv2img=cv2.imread('a.jpg')out=cv2.imwrite('a.png',img)#jpg转png
❷ python的文件格式有两种,"*.py"和"*.pyw",它们有什么不同
它们之间的不同就只有一个:视窗运行它们的时候调用不同的执行档案。
视窗用 python.exe 运行 .py ,用 pythonw.exe 运行 .pyw 。
这纯粹是因为安装视窗版 Python 时,扩展名 .py 自动被登记为用 python.exe 运行的文件,而 .pyw 则被登记为用 pythonw.exe 运行。
主要体现在win平台上开发桌面程序,linux木有哦 python.exe 运行 .py ,用 pythonw.exe 运行 .pyw,不出现dos窗口, 住:纯图形界面程序的用户不需要看到dos窗口。
(2)pythonmdx格式文件扩展阅读
Python open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError。
注意:使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。
open() 函数常用形式是接收两个参数:文件名(file)和模式(mode)。
完整的语法格式为:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
❸ 如何把 MDX 格式词典转换成 Kindle 字典
一、准备工作转换过程中需要用到以下软件,请点击链接下载备用。GetDict.exe*转换 StarDict 字典可不下载python *如果系统已安装请忽略tab2opf.pymobigen.exeStarDict注:python 要安装 2.7.x 版本,而不要安装 3.x 版二、转换步骤下面以 MDX 格式的“牛津高阶英语词典(第8版)”举例说明(你也可以使用自己下载到的 MDX 词典文件),详细演示如何一步一步地将其转换成 MOBI 格式的 Kindle 字典。1、将 MDX 字典转换成 MDX 源文件运行程序 GetDict.exe。在“选择MDX词典”这项中,点击【浏览…】选择准备好的 MDX 文件,如“牛津高阶英语词典(第8版).mdx”;在“转出文件”这项中,点击【浏览…】选择字典源文件输出路径,建议新建一个文件夹,如“oa8”,输入文件名,如“oa8”,点击【保存】按钮;其它选项保持默认,点击【开始转化】按钮,在弹出的对话框“词典名称”中输入词典的名称,如“oa8”,点击【确定】按钮开始转换。转换完毕后,在“oa8”这个文件夹中会出现 oa8.dict、oa8.idx 和 oa8.ifo 三个文件。注意,如果你下载到 MDX 词典本身就是源文件的形式,则可以忽略上面的步骤。不过如果遇到词典源文件后缀为 .dict 的文件后还有一个 .dz,如“***.dict.dz”,需要将 dz 重命名为 gz,并用 7-zip 软件解压,得到“***.dict”文件,然后将后缀名为 .dict 的文件名重命名一下,和其他两个文件的文件名统一起来。2、将 MDX 字典转换成 TXT 文件解压缩下载到的“StarDict.zip”,运行文件夹里的“stardict-editor.exe”,切换到“DeCompile/Verify”标签,点击【browse…】按钮,选择“oa8”文件夹中的后缀名为 .ifo 的文件。然后点击【Decompile】按钮,稍候片刻。直到出现提示信息“Done!”,即表示转换成功。此时“oa8”文件夹中会出现一个转换得到的名为“oa8.txt”的文本文档。建议检查一下这个文档的内容是否显示正常,如果出现了乱码,请将其更改成正确的编码再保存。否则,后面转换字典文件时出现类似“Source file is not valid UTF8.”的错误提示。3、将 TXT 文件 转换成 MOBI 源文件把 tab2opf.py 拷贝到“oa8”文件夹内。打开“命令提示符”,并用 cd 命令定位到“oa8”目录下,输入以下命令(如果已将 python 添加到环境变量则无需输入 python 的全路径):c:\python27\python.exe tab2opf.py -utf oa8.txt等待命令运行完毕之后,在“oa8”文件夹下会出现一个 .opf 文件和几个 .html 文件。用记事本或代码编辑器打开其中的 .opf 文件,然后找到如下所示这段代码:<metadata><dc-metadata><dc:Identifier id="uid">oa8</dc:Identifier><dc:Title><h2>oa8</h2></dc:Title><dc:Language>EN</dc:Language></dc-metadata><x-metadata><DictionaryInLanguage>en-us</DictionaryInLanguage><DictionaryOutLanguage>en-us</DictionaryOutLanguage></x-metadata></metadata>请按照下面的提示说明(红色字符部分)修改上面所示代码:<dc:Identifier id="uid">词典文件标识符</dc:Identifier><dc:Title><h2>词典的名字</h2></dc:Title><dc:Language>词典的语言</dc:Language><DictionaryInLanguage>输入的语言</DictionaryInLanguage><DictionaryOutLanguage>输出的语言</DictionaryOutLanguage>其中“词典的名字”即是 Kindle 字典的正式名称,如本例中可将其修改为“牛津高阶英语词典(第8版)”。词典的语言一般不用修改,关键在于输入和输出的语言。如果是英汉词典,输入为英语 en-us,输出为汉语 zh;同理,如果是日中词典,则输入为日语 ja,输出为汉语 zh。修改完毕后,另存为,文件名不要改动,在“编码”选项中选择“UTF-8”,然后点击【保存】按钮。4、将 MOBI 源文件转换成 MOBI 文件把 mobigen.exe 拷贝到“oa8”文件夹内。把刚才生成的那个 .opf 文件拖放到 mobigen.exe 文件上,mobigen.exe 就开始将 MOBI 源文件转换成 MOBI 文件了,转换所需时长根据字典大小而有所不同。最终得到的 MOBI 格式文件就是转换好的字典文件了。将其拷贝到 Kindle 中即可使用。注意,在转换的过程中会出现类似“Warning(prcgen):Some syntax error happend in a script …”或“Error: Unexpected token found”之类的提示,这是因为源文件中有一些 javascript 脚本,在转化的过程中被 mobigen 忽略掉了。经过测试不影响最终生成字典文件的使用。三、已知问题通过此方法转换的字典,其查询是严格匹配,不支持模糊检索,所以会导致单词变形无法匹配。
❹ 如何打开python文件
python文件是文本格式的,任何文本编辑器软件都可以打开,如:记事本,editplus,notepad++,vim等
❺ 如何利用 Python 读取数据科学中常见几种文件
前言如果你是数据行业的一份子,那么你肯定会知道和不同的数据类型打交道是件多么麻烦的事。不同数据格式、不同压缩算法、不同系统下的不同解析方法——很快就会让你感到抓狂!噢!我还没提那些非结构化数据和半结构化数据呢。对于所有数据科学家和数据工程师来说,和不同的格式打交道都乏味透顶!但现实情况是,人们很少能得到整齐的列表数据。因此,熟悉不同的文件格式、了解处理它们时会遇到的困难以及处理某类数据时的最佳/最高效的方法,对于任何一个数据科学家(或者数据工程师)而言都必不可少。在本篇文章中,你会了解到数据科学家或数据工程师必须知道的几种常规格式。我会先向你介绍数据行业里常用的几种不同的文件格式。随后,我会向大家介绍如何在 Python 里读取这些文件格式。PS:在后文中提到的数据科学家,同样也包括数据工程师以及所有的数据科学专家。目录文件格式是什么。数据科学家应当了解各种不同文件格式的原因。不同的文件格式以及从 Python 中读取这些文件的方法。1. 逗号分隔值2. XLSX3. ZIP4. 纯文本(txt)5. JSON6. XML7. HTML8. 图像9. 分层数据格式10. PDF11. DOCX12. MP313. MP41. 文件格式是什么。文件格式是计算机为了存储信息而使用的对信息的特殊编码方式。首先,文件格式代表着文件的类型,如二进制文件或者 ASCII 文件等。其次,它体现了信息组织的方式。比如,逗号分隔值(CSV)文件格式用纯文本来储存列表数据。为了识别一个文件的格式,你通常会去看这个文件的扩展名。比如,一个以“CSV”格式保存的名为“Data”的文件下方的文件名会显示为“Data.csv”。看到“.csv”这个扩展名,我们就会清楚地知道这是一个“CSV”文件,并且还可以知道其中的数据是以表格的形式储存的。2. 数据科学家应当了解各种不同文件格式的原因。通常,你碰到的文件类型取决于你当下构造的应用。举个例子,在一个图像处理系统中,你需要把图像作为输入和输出。所以,你所见到的文件大都是jpeg、gif 或者 png 格式的。作为一个数据科学家,你需要了解各种文件格式的底层结构以及相应的优势和劣势。只有了解了数据的底层结构,你才能够进一步去探索它,或者决定如何来储存相关的数据。选择一个最理想的文件格式来储存数据能够提升你的模型在处理数据时的性能。现在,让我们讨论一下下方这些文件格式以及如何在 Python 中读取它们:逗号分隔值(CSV)XLSXZIP纯文本(txt)JSONXMLHTML图像分层数据格式PDFDOCXMP3MP43. 不同的文件格式以及从 Python 中读取这些文件的方法。3.1 逗号分隔值逗号分隔值文件格式属于电子表格文件格式的一种。什么是电子表格文件格式?在电子表格文件格式中,数据被储存在单元格里。每个单元格都处于特定的行和列中。电子表格文件中的列拥有不同的类型。比如说,它可以是字符串型的、日期型的或者整数型的。最常用的电子表格文件格式包括:逗号分隔值(CSV)、Microsoft Excel 电子表格(xls)以及 Microsoft Excel Open XML 电子表格(xlsx)。CSV 文件中的每一行都代表一份观察报告,或者也可以说是一条记录。每一个记录都包含一个或者更多由逗号分隔的字段。有时你看你会遇到用制表符而非逗号来分隔字段的文件。这种文件格式被称为 TSV(制表符分隔值)文件格式。下面是一个用 Notepad 打开的 CSV 文件。在Python 中从 CSV 文件里读取数据现在让我们看看如何在 Python 中读取一个 CSV 文件。你可以用 Python 中的“pandas”库来加载数据。import pandas as pddf = pd.read_csv(“/home/Loan_Prediction/train.csv”)上方的代码将会把 train.csv 文件加载进 DataFrame df 中。3.2 XLSX文件XLSX 是 Microsoft Excel Open XML 的文件格式,它同样可以归入电子表格文件格式这一类中。它是由 Microsoft Excel 开发的一种基于 XML 文件格式。Microsoft Office 2007 最先采用 XLSX 格式来储存数据。在XLSX 中,数据被放在工作表的单元格和列当中。每个 XLSX 文件可能包含一个或者更多工作表,所以一个工作簿中可能会包含多个工作表。下面是一个在 Microsoft Excel 中打开的“xlsx”文件。上图显示的这个文件里包含多个工作表,这些工作表的名称分别为 Customers、Employees、Invoice 和 Order。图片中显示的是其中一个工作表——“Invoice”——中的数据。从XLSX 文件读取数据让我们一起来加载一下来自 XLSX 文件的数据并且定义一下相关工作表的名称。此时,你可以用 Python 中的“pandas”库来加载这些数据。import pandas as pddf = pd.read_excel(“/home/Loan_Prediction/train.xlsx”,sheetname = “Invoice”)上方的代码将会把来自“train.xlsx”文件的工作表“Invoice”加载进 DataFrame df 中。3.3 ZIP 文件ZIP 格式是一种归档文件格式。什么是归档文件格式?在归档文件格式中,你可以创建一个包含多个文件和元数据的文件。归档文件格式通常用于将多个数据文件放入一个文件中的过程。这么做是为了方便对这些文件进行压缩从而减少储存它们所需的存储空间。有很多种常用的电脑数据归档格式可以创建归档文件。Zip、RAR 和 Tar 是最常用的3种用于压缩数据的归档文件格式。因此,ZIP 文件格式是一种无损压缩格式,这意味着如果你用 ZIP 格式压缩了多个文件,那么在解压缩之后你能够完全恢复这些数据。ZIP 文件格式使用多种压缩算法来压缩文件。你可以通过 .zip 这个扩展名轻易地识别出一个 ZIP 文件。在Python 中读取 .ZIP 文件你可以通过导入“zipfile”包来读取 zip 文件。下方的代码可以实现读取“T.zip”中的“train.csv”文件。import zipfile在这里我已经讨论了其中一种最常用的归档格式,也已经讨论了如何在 python 中打开这种归档格式。我不会再对其他的归档格式进行展开讨论。如果你想了解不同类型的归档格式并且想对其做出比较
❻ python生成的文件什么格式
python文件扩展名是.py用python生成的文件格式就很多种了。
❼ 为什么python运行后会有附带奇怪的文件格式
是pyc文件吧。。。因为你导入了自定义模块吧。。。pyc是中间件,你导入的模块,python会生成导入模块的编译代码,加快速度。。
❽ python的编写格式
读取键盘输入【raw_input( )或者input( )】>>> demo = raw_input('INPUT:'); \ # \是在CMD中的换行符… print "content is" , demoINPUT:HELL0 MOMOcontent is HELL0 MOMO打开或关闭文件,这里要用Python的内置函数open( ),然后创建一个file对象。Python打开文件的模式:r 以只读模式打开文件。w 以只写模式打开文件,且先把文件内容清空(truncate the file first)wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。a 以添加模式打开文件,写文件的时候总是写到文件末尾,用seek也无用。打开的文件也是不能读的。r+ 以读写方式打开文件,文件可读可写,可写到文件的任何位置。w+ 和r+不同的是,它会truncate the file first。a+ 和r+不同的是,它只能写到文件末尾。一个文件被打开后,有一个file对象,可以得到有关该文件的各种信息,以下是一些使用方法:file.closed 返回true如果文件已被关闭,否则返回false。file.mode 返回被打开文件的访问模式。file.name 返回文件的名称。file.softspace 如果用print输出后,必须跟一个空格符,则返回false。否则返回true。举个例子>>> demo = open("MOMO.txt","wb")>>> print u'是否关闭:', demo.closed是否关闭:False>>> print u'访问模式:',demo.mode访问模式: wb>>> print u'文件名称:',demo.name文件名称:MOMO.txt>>> print u'末尾是否加空格:',demo.softspace末尾是否加空格:0
未经允许不得转载:山九号 » pythonmdx格式文件|如何把 MDX 格式词典转换成 Kindle 字典