計算機處理的資訊是以二進位制數的形式表示的,因此壓縮軟體就是把二進位制資訊中相同的字串以特殊字元標記來達到壓縮的目的。為了有助於理解檔案壓縮,請您在腦海裡想象一幅藍天白雲的圖片。對於成千上萬單調重複的藍色像點而言,與其一個一個定義“藍、藍、藍……”長長的一串顏色,還不如告訴電腦:“從這個位置開始儲存1117個藍色像點”來得簡潔,而且還能大大節約儲存空間。這是一個非常簡單的影象壓縮的例子。其實,所有的計算機檔案歸根結底都是以“1”和“0”的形式儲存的,和藍色像點一樣,只要透過合理的數學計算公式,檔案的體積都能夠被大大壓縮以達到“資料無損稠密”的效果。總的來說,壓縮可以分為有損和無失真壓縮兩種。如果丟失個別的資料不會造成太大的影響,這時忽略它們是個好主意,這就是有失真壓縮。有失真壓縮廣泛應用於動畫、聲音和影象檔案中,典型的代表就是影碟檔案格式MPEG、音樂檔案格式MP3和影象檔案格式JPG。 壓縮原理 ??很多人都驚異於壓縮技術的神奇,一個檔案被壓縮成一半大小,何以能無損還原呢? ??早期使用的壓縮技術都基於統計模型,到20世紀80年代初基於字典壓縮的新技術才慢慢推廣開來。 ??資料壓縮包含了非常多的軟體和硬體技術,這些技術各不相同,但是大多數壓縮軟體都是基於LZ77、LZ88演算法並加以修正而成,而LZ77是字典壓縮的起源。大家都知道一個文字檔案是由一些單片語成,而且必定有重複現象發生,例如我們這裡經常出現的“壓縮軟體”一詞,壓縮的原理就是在檔案的頭部做一個類似字典的東西,把“壓縮軟體”這個詞放在“字典”中,併為這個詞指定一個佔較少位元組數的編碼,而文章中的“壓縮軟體” 一詞均用此編碼代替,以達到壓縮的目的。當然壓縮軟體在實際運作中並非如此簡單,還要使用一些看了就頭痛的演算方法,在此就不一一細述。也許有人會問,文字檔案可用字典技術,那其它檔案怎麼辦呢。這就無須操心了,因為對於壓縮軟體來說,一個檔案中的“資料壓縮”一詞和“@#¥%^” 是一樣的,關鍵在於冗餘碼(重複部分)的多少。 ??壓縮常識 ??按壓縮方式分:有所謂的“透明壓縮”和“打包壓縮”。 ??“透明壓縮”一般針對.exe和.com檔案,直接壓縮。成功的話,檔案體積變小,功能不變,執行速度還可能更快。但是,這種壓縮方法的物件面很窄。如果壓縮失敗,還會造成檔案不可用。所以,這一類程式總是強烈要求使用者在壓縮前將檔案備份。 ??“打包壓縮”就是現在常提到的壓縮軟體使用的壓縮法。它把一個或多個檔案壓縮成一個檔案——壓縮包。要使用壓縮後的檔案,必須先解壓將檔案復原。它的特點是風險小,適用於減小不常用的檔案所佔空間和傳輸資料。當然,按照壓縮演算法,我們還可以將壓縮分成很多種。 ??一般我們在談到壓縮時,會提到許多相關術語,下面我們就提出一些常見的術語進行解釋。 ??壓縮格式:壓縮檔案時使用的壓縮編碼方法不同,壓縮生成的檔案結構就不同,這種壓縮檔案結構就稱壓縮格式。 ??壓縮比率:檔案壓縮後佔用的磁碟空間與原檔案的比率稱壓縮比率。在常用的壓縮格式中,RAR格式壓縮比率較高,ZIP格式較低。但ZIP格式的檔案操作速度較快。 ??解壓:將壓縮檔案還原為本來的檔案格式,也稱釋放、擴充套件。 ??壓縮包:一般將通用壓縮格式的檔案稱為壓縮包,如ZIP格式壓縮檔案。這種檔案可以在壓縮工具的管理下對包中壓縮的檔案進行管理,如檢視、刪除、新增等。 ??打包:將檔案壓縮成通用壓縮格式的壓縮包檔案稱為打包,也指將檔案壓縮新增到壓縮包。 ??多卷壓縮:將壓縮的檔案包分成幾個壓縮檔案稱為多卷壓縮,一般是為了將壓縮檔案儲存在多個軟磁碟上或方便網上傳輸。 ??自解壓檔案:將檔案壓縮生成可執行的檔案,然後在沒有壓縮工具的幫助下,透過執行壓縮的檔案,就可將自己的原始檔解壓還原出來。 ??壓縮檔案格式 ??目前流行著多種壓縮檔案格式,下面我們就來看看到底有哪些吧! ??ZIP:目前最流行的壓縮檔案格式(在Internet上,ZIP檔案已經取得了絕對勝利。在日常操作中,除專門的壓縮軟體之外,許多檔案管理程式,如Windows Commander等也都支援ZIP格式)。我們可利用WinZip對ZIP檔案進行解壓、釋放等操作,還可以用它來處理ARJ、ARC、CAB、LZH等多種不同格式的壓縮檔案,從而大大地方便了使用者的操作。 ??RAR:是一種高效快速的檔案壓縮格式,但不被大多數檔案壓縮程式支援,WinRAR是在Windows下處理RAR格式檔案的最好工具。 ??ARJ:由DOS下曾經紅極一時的壓縮軟體ARJ壓縮而成的檔案格式,它具有功能強大、壓縮率高等優點。到了現在的Windows時代,它已經沒有了往日的輝煌。 ??CAB:是Windows 98新增的一種特殊壓縮檔案格式,主要用於對有關軟體安裝盤中的檔案進行壓縮,其特點是壓縮率非常高(可能是目前最高的),但一經壓縮就不能再進行任何增加、刪除、替換等修改,也就是說它的壓縮包具有“只讀”屬性。我們也可使用WinZip對CAB壓縮包進行操作。 ????_:軟體安裝盤所採用的一種壓縮檔案方式,如*.ex_、*.dl_、*.d3_等,它們一般由系統直接解壓並完成安裝工作,無須使用者操心。當然,我們也可使用DOS的EXPAND命令對*.??_檔案進行釋放操作。 ??UU/UUE:漢字編碼方式,它們原本是Unix系統中使用的一種編碼方式,後來被改寫到DOS中,我們在傳送中文郵件時只須事先使用該方式進行編碼,此後就能順利透過只能處理7位編碼的郵件伺服器,從而解決了漢字的傳輸問題。 ??ACE:一種新式的壓縮程式,壓縮比很高。 ??另外,MP3、MPEG、JPG等音訊、影片、影象格式的檔案也都採用了壓縮技術,從理論上來說它們也應該算壓縮檔案,不過它們所採用的壓縮方式並不相同,這裡簡單地介紹一下: ??JPEG:JPEG 全名為 Joint Photographic Experts Group,它是一個在國際標準組織(ISO)下從事靜態影像壓縮標準制定的委員會。它制定出了第一套國標靜態影像壓縮標準:ISO 10918-1 就是我們俗稱的JPEG了。由於JPEG優良的品質,使得它在短短的幾年內就獲得極大的成功,目前網站上80%的影像都是採用JPEG的壓縮標準。 ??JPEG 2000:正式名稱為“ISO 15444”,同樣是由JPEG 組織負責制定。JPEG 2000與傳統 JPEG 最大的不同,在於它放棄了JPEG所採用的以離散餘弦轉換為主的區塊編碼方式,而改以小波轉換為主的多解析編碼方式。其壓縮率比 JPEG高約30%左右,同時支援有損和無失真壓縮,無失真壓縮對儲存一些重要圖片十分有用。 ??MP3:這個大家應該都認識它了,MP3全稱是MPEG 1 Layer 3,是一種高效能的聲音壓縮編碼方案,它可以做出超小“體積”的音樂檔案,大小隻是原始音訊資料的1/10到1/12。但人耳聽起來,效果卻沒有太大差異。它一出世就幾乎佔領了電腦音樂領域,由於MP3的出現,過去在因特網上半小時才能下載完的一首歌曲,現在以MP3格式僅需短短的幾分鐘就可以“搞定”。 ??MPEG:MPEG是Moving Pictures Experts Group(動態影象專家組)的縮寫。 現在使用的有4個版本:MPEG-1、MPEG-2、MPEG-3、MPEG-4。
計算機處理的資訊是以二進位制數的形式表示的,因此壓縮軟體就是把二進位制資訊中相同的字串以特殊字元標記來達到壓縮的目的。為了有助於理解檔案壓縮,請您在腦海裡想象一幅藍天白雲的圖片。對於成千上萬單調重複的藍色像點而言,與其一個一個定義“藍、藍、藍……”長長的一串顏色,還不如告訴電腦:“從這個位置開始儲存1117個藍色像點”來得簡潔,而且還能大大節約儲存空間。這是一個非常簡單的影象壓縮的例子。其實,所有的計算機檔案歸根結底都是以“1”和“0”的形式儲存的,和藍色像點一樣,只要透過合理的數學計算公式,檔案的體積都能夠被大大壓縮以達到“資料無損稠密”的效果。總的來說,壓縮可以分為有損和無失真壓縮兩種。如果丟失個別的資料不會造成太大的影響,這時忽略它們是個好主意,這就是有失真壓縮。有失真壓縮廣泛應用於動畫、聲音和影象檔案中,典型的代表就是影碟檔案格式MPEG、音樂檔案格式MP3和影象檔案格式JPG。 壓縮原理 ??很多人都驚異於壓縮技術的神奇,一個檔案被壓縮成一半大小,何以能無損還原呢? ??早期使用的壓縮技術都基於統計模型,到20世紀80年代初基於字典壓縮的新技術才慢慢推廣開來。 ??資料壓縮包含了非常多的軟體和硬體技術,這些技術各不相同,但是大多數壓縮軟體都是基於LZ77、LZ88演算法並加以修正而成,而LZ77是字典壓縮的起源。大家都知道一個文字檔案是由一些單片語成,而且必定有重複現象發生,例如我們這裡經常出現的“壓縮軟體”一詞,壓縮的原理就是在檔案的頭部做一個類似字典的東西,把“壓縮軟體”這個詞放在“字典”中,併為這個詞指定一個佔較少位元組數的編碼,而文章中的“壓縮軟體” 一詞均用此編碼代替,以達到壓縮的目的。當然壓縮軟體在實際運作中並非如此簡單,還要使用一些看了就頭痛的演算方法,在此就不一一細述。也許有人會問,文字檔案可用字典技術,那其它檔案怎麼辦呢。這就無須操心了,因為對於壓縮軟體來說,一個檔案中的“資料壓縮”一詞和“@#¥%^” 是一樣的,關鍵在於冗餘碼(重複部分)的多少。 ??壓縮常識 ??按壓縮方式分:有所謂的“透明壓縮”和“打包壓縮”。 ??“透明壓縮”一般針對.exe和.com檔案,直接壓縮。成功的話,檔案體積變小,功能不變,執行速度還可能更快。但是,這種壓縮方法的物件面很窄。如果壓縮失敗,還會造成檔案不可用。所以,這一類程式總是強烈要求使用者在壓縮前將檔案備份。 ??“打包壓縮”就是現在常提到的壓縮軟體使用的壓縮法。它把一個或多個檔案壓縮成一個檔案——壓縮包。要使用壓縮後的檔案,必須先解壓將檔案復原。它的特點是風險小,適用於減小不常用的檔案所佔空間和傳輸資料。當然,按照壓縮演算法,我們還可以將壓縮分成很多種。 ??一般我們在談到壓縮時,會提到許多相關術語,下面我們就提出一些常見的術語進行解釋。 ??壓縮格式:壓縮檔案時使用的壓縮編碼方法不同,壓縮生成的檔案結構就不同,這種壓縮檔案結構就稱壓縮格式。 ??壓縮比率:檔案壓縮後佔用的磁碟空間與原檔案的比率稱壓縮比率。在常用的壓縮格式中,RAR格式壓縮比率較高,ZIP格式較低。但ZIP格式的檔案操作速度較快。 ??解壓:將壓縮檔案還原為本來的檔案格式,也稱釋放、擴充套件。 ??壓縮包:一般將通用壓縮格式的檔案稱為壓縮包,如ZIP格式壓縮檔案。這種檔案可以在壓縮工具的管理下對包中壓縮的檔案進行管理,如檢視、刪除、新增等。 ??打包:將檔案壓縮成通用壓縮格式的壓縮包檔案稱為打包,也指將檔案壓縮新增到壓縮包。 ??多卷壓縮:將壓縮的檔案包分成幾個壓縮檔案稱為多卷壓縮,一般是為了將壓縮檔案儲存在多個軟磁碟上或方便網上傳輸。 ??自解壓檔案:將檔案壓縮生成可執行的檔案,然後在沒有壓縮工具的幫助下,透過執行壓縮的檔案,就可將自己的原始檔解壓還原出來。 ??壓縮檔案格式 ??目前流行著多種壓縮檔案格式,下面我們就來看看到底有哪些吧! ??ZIP:目前最流行的壓縮檔案格式(在Internet上,ZIP檔案已經取得了絕對勝利。在日常操作中,除專門的壓縮軟體之外,許多檔案管理程式,如Windows Commander等也都支援ZIP格式)。我們可利用WinZip對ZIP檔案進行解壓、釋放等操作,還可以用它來處理ARJ、ARC、CAB、LZH等多種不同格式的壓縮檔案,從而大大地方便了使用者的操作。 ??RAR:是一種高效快速的檔案壓縮格式,但不被大多數檔案壓縮程式支援,WinRAR是在Windows下處理RAR格式檔案的最好工具。 ??ARJ:由DOS下曾經紅極一時的壓縮軟體ARJ壓縮而成的檔案格式,它具有功能強大、壓縮率高等優點。到了現在的Windows時代,它已經沒有了往日的輝煌。 ??CAB:是Windows 98新增的一種特殊壓縮檔案格式,主要用於對有關軟體安裝盤中的檔案進行壓縮,其特點是壓縮率非常高(可能是目前最高的),但一經壓縮就不能再進行任何增加、刪除、替換等修改,也就是說它的壓縮包具有“只讀”屬性。我們也可使用WinZip對CAB壓縮包進行操作。 ????_:軟體安裝盤所採用的一種壓縮檔案方式,如*.ex_、*.dl_、*.d3_等,它們一般由系統直接解壓並完成安裝工作,無須使用者操心。當然,我們也可使用DOS的EXPAND命令對*.??_檔案進行釋放操作。 ??UU/UUE:漢字編碼方式,它們原本是Unix系統中使用的一種編碼方式,後來被改寫到DOS中,我們在傳送中文郵件時只須事先使用該方式進行編碼,此後就能順利透過只能處理7位編碼的郵件伺服器,從而解決了漢字的傳輸問題。 ??ACE:一種新式的壓縮程式,壓縮比很高。 ??另外,MP3、MPEG、JPG等音訊、影片、影象格式的檔案也都採用了壓縮技術,從理論上來說它們也應該算壓縮檔案,不過它們所採用的壓縮方式並不相同,這裡簡單地介紹一下: ??JPEG:JPEG 全名為 Joint Photographic Experts Group,它是一個在國際標準組織(ISO)下從事靜態影像壓縮標準制定的委員會。它制定出了第一套國標靜態影像壓縮標準:ISO 10918-1 就是我們俗稱的JPEG了。由於JPEG優良的品質,使得它在短短的幾年內就獲得極大的成功,目前網站上80%的影像都是採用JPEG的壓縮標準。 ??JPEG 2000:正式名稱為“ISO 15444”,同樣是由JPEG 組織負責制定。JPEG 2000與傳統 JPEG 最大的不同,在於它放棄了JPEG所採用的以離散餘弦轉換為主的區塊編碼方式,而改以小波轉換為主的多解析編碼方式。其壓縮率比 JPEG高約30%左右,同時支援有損和無失真壓縮,無失真壓縮對儲存一些重要圖片十分有用。 ??MP3:這個大家應該都認識它了,MP3全稱是MPEG 1 Layer 3,是一種高效能的聲音壓縮編碼方案,它可以做出超小“體積”的音樂檔案,大小隻是原始音訊資料的1/10到1/12。但人耳聽起來,效果卻沒有太大差異。它一出世就幾乎佔領了電腦音樂領域,由於MP3的出現,過去在因特網上半小時才能下載完的一首歌曲,現在以MP3格式僅需短短的幾分鐘就可以“搞定”。 ??MPEG:MPEG是Moving Pictures Experts Group(動態影象專家組)的縮寫。 現在使用的有4個版本:MPEG-1、MPEG-2、MPEG-3、MPEG-4。