前言
利用Python docx模塊,可以很方便地打開(kāi)和修改Word 2007及以后的文檔。本文簡(jiǎn)單地介紹了如何使用python修改word文檔中的內(nèi)容。
![](/d/20211017/59a4cc63f588829d01056a2ccfcfc210.gif)
例子與代碼
word文檔的內(nèi)容是一封表?yè)P(yáng)信,內(nèi)容見(jiàn)下圖:
![](/d/20211017/bbcc147c25cdf30cfc297d46ffc935eb.gif)
表?yè)P(yáng)信.png
現(xiàn)在需要通過(guò)python對(duì),”表?yè)P(yáng)信.docx”文檔進(jìn)行修改,需要修改的地方已在圖中標(biāo)記出。
1、第一個(gè)箭頭處,首行縮進(jìn)2字符
2、第二個(gè)箭頭處,對(duì)段落進(jìn)行左縮進(jìn)2字符,并添加“向小z同學(xué)學(xué)習(xí)!”
3、第三個(gè)和第四個(gè)箭頭處,進(jìn)行右對(duì)齊,并右縮進(jìn)2cm
4、趙東來(lái),修改為小z
5、陸亦可,修改為大Z
6、她,修改為他
7、狗糧,修改為貓糧
代碼如下:
from docx import Document
from docx.shared import Cm
from docx.enum.text import WD_ALIGN_PARAGRAPH
import re
document=Document(r"g:\CS\Python Scripts\表?yè)P(yáng)信.docx")
# 首先對(duì)段落格式進(jìn)行修改,docx默認(rèn)標(biāo)題也屬于段落,因此“表?yè)P(yáng)信”是第一段
paragraphs=document.paragraphs
paragraphs[2].paragraph_format.first_line_indent=Cm(0.74)
paragraphs[3].paragraph_format.left_indent=Cm(0.74)
paragraphs[4].paragraph_format.alignment=WD_ALIGN_PARAGRAPH.RIGHT
paragraphs[4].paragraph_format.right_indent=Cm(2)
paragraphs[5].paragraph_format.alignment=WD_ALIGN_PARAGRAPH.RIGHT
paragraphs[5].paragraph_format.right_indent=Cm(2)
# 對(duì)文本進(jìn)行修改
# 修改第二段
paragraphs[1].text="小Z同學(xué):"
# 將第三段陸亦可替換為大Z,她替換為他。通過(guò)python的正則表達(dá)式,可以很簡(jiǎn)單地實(shí)現(xiàn)文本的替換和查找。
text=re.sub('陸亦可','大Z',paragraphs[2].text)
text=re.sub('她','他',text)
paragraphs[2].text=text
# 在第四段后面加上
paragraphs[3].add_run("向小z同學(xué)學(xué)習(xí)!")
# 修改表格里面的內(nèi)容
tables=document.tables
tables[0].cell(1,0).text="貓糧"
tables[0].cell(2,0).text="貓糧"
tables[0].cell(3,0).text="貓糧"
# 插入一張圖片,圖片寬度設(shè)置為11.8cm
document.add_picture('fun.jpg', width=Cm(11.8))
document.save()
運(yùn)行代碼,結(jié)果見(jiàn)下圖:
![](/d/20211017/a8da117a0d212784221e4499d13164cf.gif)
修改后.png
本文對(duì)word文檔中的內(nèi)容主要在如下幾方面進(jìn)行了修改:
段落文字的替換和添加
段落排列的對(duì)齊和縮進(jìn)
表格文字的修改
在文檔中插入圖片
docx模塊功能強(qiáng)大,還支持對(duì)word文檔,字體、顏色、樣式、章節(jié)、分頁(yè)符、制表位等的修改。通過(guò)python批量化操作word文檔,可以有效地節(jié)省時(shí)間,告別繁瑣重復(fù)的工作。
結(jié)論
通過(guò)對(duì)word文檔段落、表格和圖片的操作,結(jié)合python的正則表達(dá)式,目前,可以想到的能實(shí)現(xiàn)的功能如下:
1、批量制作word名片、信件、通知等(功能與word郵件合并功能類(lèi)似)
2、對(duì)多個(gè)文檔的內(nèi)容進(jìn)行一鍵提取和替換
3、通過(guò)docx模塊,python將Excel、郵件、網(wǎng)頁(yè)、matplotlib、支持python接口的軟件等資源整合在一起,提取相關(guān)信息,自動(dòng)生成word報(bào)告
4、在女朋友面前裝逼
后續(xù)有時(shí)間,將對(duì)docx模塊中的paragraph(段落)、table(表格)等對(duì)象進(jìn)行詳細(xì)的介紹。
補(bǔ)充:Python修改Word文檔內(nèi)容和插入圖片
代碼如下
#!/usr/bin/python
# coding:utf-8
import docx
def main():
filepath = 'test.docx'
filepath1 = 'wtest.docx'
newdocx = docx.Document(filepath)
table = newdocx.tables
for oTable in table:
rows_num = len(oTable.rows)
columns_num = len(oTable.columns)
cell = oTable.cell(3, 0)
# cell.add_paragraph("a")
cell.text = ""
cell.paragraphs[-1].runs[0].add_picture('t1.jpg')
print(rows_num)
print(columns_num)
newdocx.save(filepath1)
if __name__ == '__main__':
main()
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
您可能感興趣的文章:- python提取word文件中的所有圖片
- python實(shí)現(xiàn)某考試系統(tǒng)生成word試卷
- 使用Python自動(dòng)化Microsoft Excel和Word的操作方法
- Python 制作詞云的WordCloud參數(shù)用法說(shuō)明
- Python WordCloud 修改色調(diào)的實(shí)現(xiàn)方式
- python 將Excel轉(zhuǎn)Word的示例
- Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例
- python3處理word文檔實(shí)例分析
- Python word文本自動(dòng)化操作實(shí)現(xiàn)方法解析
- Python快速優(yōu)雅的批量修改Word文檔樣式