這個問題我覺得可以從兩個方面去理解,第一,txt文字檔案裡的資料是否有規律性;第二、python讀取文字資料。
文字檔案中的資料是否按照某種規律儲存,這直接決定著後續工作中的效率與質量,所以在處理檔案前,需要檢查一下資料是否按照特定的格式儲存,會不會有其它特殊的情況影響到後續的資料處理,比如某個欄位的值中包含逗號,而我們的分列採用的也是逗號,這種情況的發生直接影響到後續的資料讀取拆分的問題,很有可能造成陣列提示。在這裡我舉一個按照某種規律儲存的文字。
python讀取文字的語法相對來說還是比較簡單的,開啟檔案,讀取檔案和關閉檔案三步。
f = open(file_name) 表示開啟檔案
line = f.readlines() 表示一次性讀取資料到記憶體中
f.close()表示關閉檔案
讀取完檔案後就是需要處理檔案中的內容,在這裡re可能會用得上,即我們透過正則表示式去匹配去我們想要的資料,然後對資料進行相應的處理,最後得到我們想要的資料。
最後,我們可以將相應的資料寫到資料庫中,或者寫到本地的檔案中,txt、csv、excel都可以。看自己比較喜歡那種格式。
這個問題我覺得可以從兩個方面去理解,第一,txt文字檔案裡的資料是否有規律性;第二、python讀取文字資料。
txt文字檔案資料是否規律,直接影響到資料讀取的結果文字檔案中的資料是否按照某種規律儲存,這直接決定著後續工作中的效率與質量,所以在處理檔案前,需要檢查一下資料是否按照特定的格式儲存,會不會有其它特殊的情況影響到後續的資料處理,比如某個欄位的值中包含逗號,而我們的分列採用的也是逗號,這種情況的發生直接影響到後續的資料讀取拆分的問題,很有可能造成陣列提示。在這裡我舉一個按照某種規律儲存的文字。
python讀取文字檔案python讀取文字的語法相對來說還是比較簡單的,開啟檔案,讀取檔案和關閉檔案三步。
f = open(file_name) 表示開啟檔案
line = f.readlines() 表示一次性讀取資料到記憶體中
f.close()表示關閉檔案
讀取完檔案後就是需要處理檔案中的內容,在這裡re可能會用得上,即我們透過正則表示式去匹配去我們想要的資料,然後對資料進行相應的處理,最後得到我們想要的資料。
最後,我們可以將相應的資料寫到資料庫中,或者寫到本地的檔案中,txt、csv、excel都可以。看自己比較喜歡那種格式。