資源描述:
《Huffman壓縮原理》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、Huffman壓縮原理科學(xué)家在研究中發(fā)現(xiàn),大多數(shù)信息的表達都存在著一定的冗余度,通過采用一定的模型和編碼方法,可以降低這種冗余度。貝爾實驗室的ClaudeShannon和MIT的R.M.Fano幾乎同時提出了最早的對符號進行有效編碼從而實現(xiàn)數(shù)據(jù)壓縮的Shannon-Fano編碼方法。D.A.Huffman于1952年第一次發(fā)表了他的論文“最小冗余度代碼的構(gòu)造方法”(AMethodfortheConstructionofMinimumRedundancyCodes)。從此,數(shù)據(jù)壓縮開始在商業(yè)程序中實現(xiàn)并被應(yīng)
2、用在許多技術(shù)領(lǐng)域。到1977年,數(shù)據(jù)壓縮的研究工作主要集中于熵、字符和單詞頻率以及統(tǒng)計模型等方面,研究者們一直在絞盡腦汁為使用Huffman編碼的程序找出更快、更好的改進方法。1977年,以色列人JacobZiv和AbrahamLempel發(fā)表了論文“順序數(shù)據(jù)壓縮的一個通用算法”(AUniversalAlogrithemforSequentialDataCompression)。1978年,他們發(fā)表了該論文的續(xù)篇“通過可變比率編碼的獨立序列的壓縮”(CompressionofIndividualSeque
3、ncesviaVariable-RateCoding)。所有的一切都改變了,在這兩篇論文中提出的兩個壓縮技術(shù)被稱為LZ77和LZ78(不知為什么,作者名字的首字母被倒置了)。簡單地說,這兩種壓縮方法的思路完全不同于從Shannon到Huffman到算術(shù)壓縮的傳統(tǒng)思路。因此,人們將基于這一思路的編碼方法稱作“字典”式編碼。字典式編碼不但在壓縮效果上大大超過了Huffman,而且,對于好的實現(xiàn),其壓縮和解壓縮的速度也異常驚人。80年代中期以后,人們對LZ77進行了改進,隨之誕生了一批我們今天還在大量使用的壓縮
4、程序。HaruyasuYoshizaki(Yoshi)的LHarc和RobertJung的ARJ是其中兩個著名的例子。LZ77得以和LZ78、LZW一起壟斷當(dāng)今的通用數(shù)據(jù)壓縮領(lǐng)域。目前,基于字典方式的壓縮已經(jīng)有了一個被廣泛認可的標(biāo)準,從古老的PKZip到現(xiàn)在的WinZip,特別是隨著Internet上文件傳輸?shù)牧餍?,ZIP格式成為了事實上的標(biāo)準,沒有哪一種通用的文件壓縮、歸檔系統(tǒng)敢于不支持ZIP格式。Huffman壓縮原理科學(xué)家在研究中發(fā)現(xiàn),大多數(shù)信息的表達都存在著一定的冗余度,通過采用一定的模型和編碼方
5、法,可以降低這種冗余度。貝爾實驗室的ClaudeShannon和MIT的R.M.Fano幾乎同時提出了最早的對符號進行有效編碼從而實現(xiàn)數(shù)據(jù)壓縮的Shannon-Fano編碼方法。D.A.Huffman于1952年第一次發(fā)表了他的論文“最小冗余度代碼的構(gòu)造方法”(AMethodfortheConstructionofMinimumRedundancyCodes)。從此,數(shù)據(jù)壓縮開始在商業(yè)程序中實現(xiàn)并被應(yīng)用在許多技術(shù)領(lǐng)域。到1977年,數(shù)據(jù)壓縮的研究工作主要集中于熵、字符和單詞頻率以及統(tǒng)計模型等方面,研究者們
6、一直在絞盡腦汁為使用Huffman編碼的程序找出更快、更好的改進方法。1977年,以色列人JacobZiv和AbrahamLempel發(fā)表了論文“順序數(shù)據(jù)壓縮的一個通用算法”(AUniversalAlogrithemforSequentialDataCompression)。1978年,他們發(fā)表了該論文的續(xù)篇“通過可變比率編碼的獨立序列的壓縮”(CompressionofIndividualSequencesviaVariable-RateCoding)。所有的一切都改變了,在這兩篇論文中提出的兩個壓縮技
7、術(shù)被稱為LZ77和LZ78(不知為什么,作者名字的首字母被倒置了)。簡單地說,這兩種壓縮方法的思路完全不同于從Shannon到Huffman到算術(shù)壓縮的傳統(tǒng)思路。因此,人們將基于這一思路的編碼方法稱作“字典”式編碼。字典式編碼不但在壓縮效果上大大超過了Huffman,而且,對于好的實現(xiàn),其壓縮和解壓縮的速度也異常驚人。80年代中期以后,人們對LZ77進行了改進,隨之誕生了一批我們今天還在大量使用的壓縮程序。HaruyasuYoshizaki(Yoshi)的LHarc和RobertJung的ARJ是其中兩個
8、著名的例子。LZ77得以和LZ78、LZW一起壟斷當(dāng)今的通用數(shù)據(jù)壓縮領(lǐng)域。目前,基于字典方式的壓縮已經(jīng)有了一個被廣泛認可的標(biāo)準,從古老的PKZip到現(xiàn)在的WinZip,特別是隨著Internet上文件傳輸?shù)牧餍校琙IP格式成為了事實上的標(biāo)準,沒有哪一種通用的文件壓縮、歸檔系統(tǒng)敢于不支持ZIP格式。?ht首先被提出來,是為了解決這樣的問題:????對于N種數(shù)據(jù)(比如5種數(shù)據(jù):A、B、C、D、E),在出現(xiàn)的頻率已知的情況下(比如分