這篇文章主要介紹了python解壓zip包中文亂碼解決方法,幫助大家更好的理解和學習python,感興趣的朋友可以瞭解下
亂碼得原因:
由於ZipFile模組匯出遇到中文解碼不對,windows上會出現,linux是否會出現不知道沒測試過。
解決方式:
1. 搞個檔名引射表(不太方便,少量資料夾套用時候還可以)
2. 修改原始碼解碼格式(不太方便,自己搞了一下,之後報其他錯誤)
3. 自己寫入檔案,自己建立資料夾(推薦)
自己建立的寫法:
with zipfile.ZipFile(file=zip_save_path, mode='r') as zf:
# 解壓到指定目錄,首先建立一個解壓目錄
os.mkdir(unzip_dir_path)
for old_name in zf.namelist():
# 獲取檔案大小,目的是區分資料夾還是檔案,如果是空檔案應該不好用。
file_size = zf.getinfo(old_name).file_size
# 由於原始碼遇到中文是cp437方式,所以解碼成gbk,windows即可正常
new_name = old_name.encode('cp437').decode('gbk')
# 拼接檔案的儲存路徑
new_path = os.path.join(unzip_dir_path, new_name)
# 判斷檔案是資料夾還是檔案
if file_size > 0:
# 是檔案,透過open建立檔案,寫入資料
with open(file=new_path, mode='wb') as f:
# zf.read 是讀取壓縮包裡的檔案內容
f.write(zf.read(old_name))
else:
# 是資料夾,就建立
os.mkdir(new_path)
結果正常: