首頁>技術>

需求描述

os 模組綜合應用glob 模組綜合應用利用 gzip zipfile rarfile tarfile 模組解壓檔案

步驟分析和前置知識

碼程式碼之前需要將複雜問題解釋成多個明確的要求,即這個程式實現的邏輯為:

定時檢測某個資料夾(如 download 資料夾)是否存在壓縮檔案如果有新出現的壓縮檔案則將其解壓到當前資料夾內的新資料夾中 刪除壓縮檔案提到壓縮檔案就要分不同壓縮格式進行討論,主要有以下4種:

提到壓縮檔案就要分不同壓縮格式進行討論,主要有以下4種:

.gz: 即 gzip,通常只能壓縮一個檔案

.tar: 本質上不是壓縮工具而是打包工具,可以跟 .gz 配合形成 .tar.gz 的打包壓縮格式 .zip: 和 .tar.gz 很類似但可以打包壓縮多個檔案

.rar: 打包壓縮檔案,最初用於 DOS

因此,檔案是否為壓縮檔案的判斷邏輯可以如下:

建立一個含壓縮包字尾的列表 compressed_lst = ['gz', 'tar', 'zip', 'rar']目標資料夾下的所有檔名執行 filename.split(.)[-1] 獲取字尾名判斷後綴名是否在 compressed_lst 中,如果存在則執行後續的解壓程式碼如果是以 gz 結尾的檔案,解壓後需要再次判斷是否是以 .tar 結尾,並進行相應處理

不同壓縮檔案的解壓程式碼各不相同,在後續程式碼操作中具體展開。

程式碼實現

首先是獲取 download 資料夾下所有檔案的檔名

import globimport ospath = r'C:\xxxx\download'file_lst = glob.glob(path + '/*')# 列表推導式filename_lst = [os.path.basename(i) for i in file_lst]print(filename_lst)

接下來根據檔案的字尾名判斷是否需要壓縮,先看一下程式碼框架

for i in filename_lst:    if '.' in i:        # 獲取字尾名        suffix = i.split('.')[-1]        # 逐個將字尾名和各格式的壓縮字尾匹配        if suffix == 'gz':            pass            if ...: # 再次判斷新產生的檔名是否以 .tar 結尾                pass        if suffix == 'tar':            pass        if suffix == 'zip':            pass        if suffix == 'rar':            pass

這裡有2個注意點:

有些檔案沒有後綴名,因此可能不存在 .,這時用 filename.split('.')[-1]會報錯,因此需要先判斷以.gz 結尾的檔案,解壓後需要再次判斷是否是以 .tar 結尾,然後我們就可以分別將四種壓縮檔案的解壓程式碼寫成函式,符合時候單獨呼叫即可1、處理.gz 檔案
import gzipdef ungz(filename):    filename = filename[:-3] # gz檔案的單檔案解壓就是去掉 filename 後面的 .gz    gz_file = gzip.GzipFile(filename)    with open(filename, "w+") as file:        file.write(gz_file.read())        return filename  # 這個gzip的函式需要返回值以進一步配合untar函式

前面反覆提及的 gz 檔案有可能跟 tar 檔案配合,因此解壓 gz 檔案後需要再判斷是否有必要解開 tar 檔案

這裡就可以先把 tar 檔案的函式寫出來

2、處理.tar檔案

import tarfiledef untar(filename):    tar = tarfile.open(filename)    names = tar.getnames()    # tar本身是將檔案打包,解除打包會產生很多檔案,因此需要建立資料夾存放    if not os.path.isdir(filename + "_dir"):        os.mkdir(filename + "_dir")    for name in names:        tar.extract(name, filename + "_dir/")    tar.close()
3、處理.zip檔案
import zipfiledef unzip(filename):    zip_file = zipfile.ZipFile(filename)    # 類似tar解除打包,建立資料夾存放解壓的多個檔案    if not os.path.isdir(filename + "_dir"):        os.mkdir(filename + "_dir")    for names in zip_file.namelist():        zip_file.extract(names, filename + "_dir/")    zip_file.close()
4、處理.rar檔案
import rarfiledef unrar(filename):    rar = rarfile.RarFile(filename)    if not os.path.isdir(filename + "_dir"):        os.mkdir(filename + "_dir")    os.chdir(filename + "_dir")    rar.extractall()    rar.close()

可以看到,四種解壓程式碼略有不同,推薦大家實際演示中自己體會一下差別,解壓後配合 os.remove() 就可以刪除壓縮包,現在看看邏輯框架補上解壓函式後的內容:

for filename in filename_lst:    if '.' in filename:        suffix = filename.split('.')[-1]        if suffix == 'gz':            new_filename = ungz(filename)            os.remove(filename)            if new_filename.split('.')[-1] == 'tar':                untar(new_filename)                os.remove(new_filename)          if suffix == 'tar':            untar(filename)            os.remove(filename)        if suffix == 'zip':            unzip(filename)            os.remove(filename)        if suffix == 'rar':            unrar(filename)            os.remove(filename)
5、實現實時檢測

比較簡單的方法就是建立 while True 死迴圈配合 time.sleep()睡眠,框架如下:

import timewhile True:    func()    time.sleep(5) # 睡眠秒數可以設定大一點避免過度佔用資源

最後將第二步的實現程式碼改為函式並放在迴圈框架中就可以完成本次需求,完整程式碼如下

import globimport osimport gzipimport tarfileimport zipfileimport rarfileimport timepath = r'C:\xxxx\download'file_lst = glob.glob(path + '/*')filename_lst = [os.path.basename(i) for i in file_lst]def ungz(filename):    filename = filename[:-3]    gz_file = gzip.GzipFile(filename)    with open(filename, "w+") as file:        file.write(gz_file.read())    return filenamedef untar(filename):    tar = tarfile.open(filename)    names = tar.getnames()    if not os.path.isdir(filename + "_dir"):        os.mkdir(filename + "_dir")    for name in names:        tar.extract(name, filename + "_dir/")    tar.close()def unzip(filename):    zip_file = zipfile.ZipFile(filename)    if not os.path.isdir(filename + "_dir"):        os.mkdir(filename + "_dir")    for names in zip_file.namelist():        zip_file.extract(names, filename + "_dir/")    zip_file.close()def unrar(filename):    rar = rarfile.RarFile(filename)    if not os.path.isdir(filename + "_dir"):        os.mkdir(filename + "_dir")    os.chdir(filename + "_dir")    rar.extractall()    rar.close()def unzip_files():    for filename in filename_lst:        if '.' in filename:            suffix = filename.split('.')[-1]            if suffix == 'gz':                new_filename = ungz(filename)                os.remove(filename)                if new_filename.split('.')[-1] == 'tar':                    untar(new_filename)                    os.remove(new_filename)            if suffix == 'tar':                untar(filename)                os.remove(filename)            if suffix == 'zip':                unzip(filename)                os.remove(filename)            if suffix == 'rar':                unrar(filename)                os.remove(filename)while True:    unzip_files()    time.sleep(5)

完整專案程式碼後臺私信小編01即可

5
最新評論
  • BSA-TRITC(10mg/ml) TRITC-BSA 牛血清白蛋白改性標記羅丹明
  • 基於opencv的多目標物體跟蹤!走到哪跟到哪