首頁>Club>
有沒有相關程式碼可供參考?
4
回覆列表
  • 1 # 小小猿愛嘻嘻

    這個不難,主要用到2個庫,一個是pdfminer3k,一個是python-docx,其中pdfminer3k用來解析pdf提取出文字內容,python-docx用來將解析出的文字內容寫入word文件,下面我簡單介紹一下實現過程,實驗環境win10+python3.6+pycharm5.0,主要內容如下:

    這裡為了方便說明問題,我新建了一個test.pdf檔案,測試內容如下,後面就是圍繞這個檔案展開解析:

    1.首先安裝pdfminer3k和python-docx,這個直接在cmd視窗輸入命令“pip install pdfminer3k python-docx”就行,如下:

    2.安裝成功後,我們就可以編寫程式來實現pdf文字轉word文件功能了,主要分為2步,先解析pdf檔案,提取出文字內容,接著再將文字內容寫入word文件中,主要程式碼及截圖如下:

    解析pdf檔案文字內容,基本思路就是建立一個pdf解析器,然後一頁一頁解析,提取出文字內容,主要程式碼如下:

    寫入word文件,這步很簡單,就是將上一步解析出的文字內容直接按段落新增到word文件中就行,這裡可以對字型字號進行設定,主要程式碼如下:

    至此,我們就完成了利用python將pdf文字轉化為word文件的功能。總的來說,整個過程不難,主要分為2步,先利用pdfminer3k解析pdf檔案,提取出文字內容,再利用python-docx將提取出來的文字內容寫入word文件中就行,只要你有一定的python基礎,熟悉一下相關程式碼和示例,多除錯幾遍程式碼,很快就能掌握的,網上也有相關教程和資料,感興趣的話,可以搜一下,希望以上分享的內容能對你有所幫助吧,也歡迎大家評論、留言。

  • 中秋節和大豐收的關聯?
  • 電鋼琴audio介面是什麼?