-
1 # 小小猿愛嘻嘻
-
2 # 疏影浮生綺夢人
一、安裝Python-docx
Python-docx是專門針對於word文件的一個模組,只能讀取docx 不能讀取doc檔案。說白了,python就相當於windows作業系統,QQ就是跑在windows作業系統上的軟體,QQ最大的作用是可以去聊天,說話。 在這裡python-docx就相當於這裡的qq 它主要的功能是對docx檔案進行操作,管理等.(個人理解,非專業!)
1.1、安裝Python-docx
1.1.1、使用虛擬環境安裝python-docx
pip install python-docx # 安裝命令
安裝結束後,在此虛擬環境中執行Jupyter notebook
jupyter notebook
1.1.2、切換工作目錄(使用 %cd命令)
%cd F:python_test1Python_office # 進入目錄
%pwd # 檢視當前的工作目錄
>>>"F:\python_test1\Python_office" # 輸出結果
二、對word文件進行編輯
在對word文件編輯之前需要匯入Document模組如下:
from docx import Document
Doc = Document()
解釋:from 從 docx這個檔案中,匯入一個叫Document的一個東西,Document是文件的意思,所以它是對word文件進行操作的一個玩意. 在下面Doc = Document() 可以理解為 Document就是一個類,這個操作也就是例項化的過程,生成物件為:Doc
那Document例項化了一個Object叫Doc 那麼Doc肯定會有很多的方法,這些方法就是對word文件進行操作的方法如下:
Doc.add_heading("Python是什麼東西???")
<docx.text.paragraph.Paragraph at 0x28033582e48>
# Doc.add_heading 意思是新增一個叫做heading的一個東西在這裡heading指的是標題的意思,也就是新增一個標題叫做python是什麼東西???執行完成後它會生成一個物件.
2.1、新增一個段落(paragraph)
Doc.add_paragraph("Python是一種面向物件的程式語言~~~") # 在這裡paragraph指的就是一個段落的意思
<docx.text.paragraph.Paragraph at 0x280335a17b8>
2.2、新增多個段落(paragraph)
Doc.add_paragraph("Python ")
Doc.add_paragraph("Python 對word進行操作")
2.3、如何檢視word文件?
寫完之後我們需要檢視首先需要儲存 如下:
Doc.save("Python_word.docx")
# save:儲存 為名字叫:Python_word.docx 的檔案
回覆列表
這裡介紹一個庫—python-docx,專門用於python讀寫word文件,使用方便、快捷,下面我簡單介紹一下這個庫的安裝和使用,實驗環境win10+python3.6+pycharm5.0,主要內容如下:
1.安裝python-docx,這個直接在cmd視窗輸入命令“pip install python-docx”就行,如下:
2.安裝完成後,我們就可以進行簡單的測試了,這裡我分別就讀取word文件和寫入word文件做了簡單介紹,主要程式碼及截圖如下:
讀取word文件,這裡以讀取文件中的段落文字和表格資料為例,示例文件如下:
對應讀取程式碼如下,很簡單,分別獲取所有段落文字和表格資料,然後迴圈列印就行,readWord函式輸入引數為需要讀取的word文件:
程式執行截圖如下,已經成功獲取到word文件的內容:
寫入word文件,這個也很簡單,構造相應資料結構,然後直接寫入word文件就行,這裡以新增標題、段落、圖片、引用、表格,設定字型、有序列表和無序列表為例,主要測試程式碼如下:
程式執行截圖如下,已經成功建立並生成word文件:
至此,我們就完成了利用python來程式設計word文件。總的來說,整個過程不難,思路不難,程式碼也不多,很好理解,只要你有一定的python基礎,熟悉一下相關示例和程式碼,多練習一下,很快就能掌握的,python-docx官網也提供了非常詳細的使用文件,非常適合初學者學習,介紹的很全面,可以參考一下https://python-docx.readthedocs.io/en/latest/index.html,網上也有相關教程和資料,感興趣的話,可以搜一下,希望以上分享的內容能對你有所幫助吧,也歡迎大家評論、留言。