這期內(nèi)容當中小編將會給大家?guī)碛嘘P(guān)Python中怎么對docx文件進行讀寫操作,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
創(chuàng)新互聯(lián)建站堅信:善待客戶,將會成為終身客戶。我們能堅持多年,是因為我們一直可值得信賴。我們從不忽悠初訪客戶,我們用心做好本職工作,不忘初心,方得始終。十載網(wǎng)站建設(shè)經(jīng)驗創(chuàng)新互聯(lián)建站是成都老牌網(wǎng)站營銷服務(wù)商,為您提供成都網(wǎng)站建設(shè)、成都網(wǎng)站制作、網(wǎng)站設(shè)計、html5、網(wǎng)站制作、品牌網(wǎng)站設(shè)計、小程序定制開發(fā)服務(wù),給眾多知名企業(yè)提供過好品質(zhì)的建站服務(wù)。
演示文本
為了方便理解,我們以 python-docx.docx 文件為例,演示如何使用Python 提取其中的文本數(shù)據(jù)和表格數(shù)據(jù),并開發(fā)自定義函數(shù)以字典的形式提取內(nèi)容,python-docx.docx文件內(nèi)容如下:
在使用python-docx 讀取word文檔中文本之前,我們先了解下python-docx 模塊的幾個概念。
Document 對象,表示一個Word文檔。
Paragraph 對象,表示W(wǎng)ord文檔中的一個段落。
Paragraph 對象的text屬性,表示段落中的文本內(nèi)容。
提取docx文件中文本信息
使用python-docx 提取docx文件中文本數(shù)據(jù),Python實現(xiàn)代碼如下:
如上,我們將python-docx.docx 文件中的文本信息,按行提取出來,存儲到字典中,字典的Key為行號,Value為文本信息,執(zhí)行上述代碼,輸出結(jié)果如下:
提取docx文件中表格數(shù)據(jù)
使用python-docx 提取docx文件中表格數(shù)據(jù),Python實現(xiàn)代碼如下:
如上,我們將python-docx.docx 文件中的表單信息,按行提取出來,存儲到列表中,列表每個元素為一個表格的數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)為字典,執(zhí)行上述代碼輸出結(jié)果如下:
寫入數(shù)據(jù)到docx文件中
我們同樣可以利用python-docx 模塊,實現(xiàn)docx文件的數(shù)據(jù)寫入,如標題、字號、引用、列表、圖片插入等等。由于如下代碼注釋中說明比較詳細,此處不做過多介紹,代碼如下:
執(zhí)行上述代碼,寫入數(shù)據(jù)保存至testops—docx.docx 文件中,內(nèi)容如下:
提取包含指定關(guān)鍵字的文本
我們基于上述自定義封裝函數(shù) extract_text、extract_form,結(jié)合re 模塊,就可以實現(xiàn)提取包含關(guān)鍵字的文本內(nèi)容,代碼實現(xiàn)如下:
如上,我們實現(xiàn)了提取docx 文本中包含指定內(nèi)容的文本信息,并輸出該內(nèi)容所在行,執(zhí)行上述代碼,輸出結(jié)果為:
上述就是小編為大家分享的Python中怎么對docx文件進行讀寫操作了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
網(wǎng)站標題:Python中怎么對docx文件進行讀寫操作
標題網(wǎng)址:http://aaarwkj.com/article14/pjdsge.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供響應(yīng)式網(wǎng)站、服務(wù)器托管、企業(yè)建站、外貿(mào)網(wǎng)站建設(shè)、網(wǎng)站設(shè)計公司、虛擬主機
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)