這裡簡單介紹一下吧,讀取pdf檔案的話,可以使用pdfminer3k這個庫,寫入pdf檔案的話,可以使用reportlab這個庫,下面我簡單介紹一下這2個庫是如何讀寫pdf檔案的,實驗環境win10+python3.6+pycharm5.0,主要內容如下:
這裡主要用到pdfminer3k這個庫,專門用來解析pdf檔案,中英文都可以,下面我簡單介紹一下這個庫的安裝和使用:
1.安裝pdfminer3k,這個直接在cmd視窗輸入命令“pip install pdfminer3k”就行,如下:
2.這裡為了更好的說明問題,我新建了一個pdf文件,測試內容如下,一段中文字串:
3.最後,就是編寫相關程式碼來解析pdf檔案了,基本思路是先建立pdf解析器,然後一頁一頁解析文字字串,然後提取打印出來就行,主要程式碼如下:
這裡可以使用reportlab這個庫,專門用來生成最終的pdf檔案(不支援中文),下面我簡單介紹一下這個庫的安裝和使用:
1.安裝reportlab,這個與上面的安裝命令類似,直接在cmd視窗輸入命令“pip install reportlab”就行,如下:
2.安裝成功後,我們就可以寫入pdf檔案了,測試程式碼如下,很簡單:
執行這個程式,就會在當前目錄下生成一個pdf檔案,開啟後的內容如下,就是剛才程式寫入的內容:
至此,我們就完成了利用python來讀寫pdf檔案。總的來說,整個過程很簡單,pdfminer3k和reportlab這2個庫可以快速完成對pdf檔案的讀寫,只要你有一定的python基礎,熟悉一下相關示例和程式碼,很快就能掌握的,唯一不足的就是不能寫入中文,pdf會出現亂碼情況,當然,你也可以使用pypdf2這個庫(也不支援中文)讀寫pdf檔案,都行,網上也有相關教程,感興趣的話,可以搜一下,希望以上分享的內容能對你有所幫助吧,也歡迎大家評論、留言。
這裡簡單介紹一下吧,讀取pdf檔案的話,可以使用pdfminer3k這個庫,寫入pdf檔案的話,可以使用reportlab這個庫,下面我簡單介紹一下這2個庫是如何讀寫pdf檔案的,實驗環境win10+python3.6+pycharm5.0,主要內容如下:
讀取pdf檔案這裡主要用到pdfminer3k這個庫,專門用來解析pdf檔案,中英文都可以,下面我簡單介紹一下這個庫的安裝和使用:
1.安裝pdfminer3k,這個直接在cmd視窗輸入命令“pip install pdfminer3k”就行,如下:
2.這裡為了更好的說明問題,我新建了一個pdf文件,測試內容如下,一段中文字串:
3.最後,就是編寫相關程式碼來解析pdf檔案了,基本思路是先建立pdf解析器,然後一頁一頁解析文字字串,然後提取打印出來就行,主要程式碼如下:
寫入pdf檔案這裡可以使用reportlab這個庫,專門用來生成最終的pdf檔案(不支援中文),下面我簡單介紹一下這個庫的安裝和使用:
1.安裝reportlab,這個與上面的安裝命令類似,直接在cmd視窗輸入命令“pip install reportlab”就行,如下:
2.安裝成功後,我們就可以寫入pdf檔案了,測試程式碼如下,很簡單:
執行這個程式,就會在當前目錄下生成一個pdf檔案,開啟後的內容如下,就是剛才程式寫入的內容:
至此,我們就完成了利用python來讀寫pdf檔案。總的來說,整個過程很簡單,pdfminer3k和reportlab這2個庫可以快速完成對pdf檔案的讀寫,只要你有一定的python基礎,熟悉一下相關示例和程式碼,很快就能掌握的,唯一不足的就是不能寫入中文,pdf會出現亂碼情況,當然,你也可以使用pypdf2這個庫(也不支援中文)讀寫pdf檔案,都行,網上也有相關教程,感興趣的話,可以搜一下,希望以上分享的內容能對你有所幫助吧,也歡迎大家評論、留言。