資源描述:
《編碼序列的計(jì)劃》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、為了適應(yīng)公司新戰(zhàn)略的發(fā)展,保障停車場(chǎng)安保新項(xiàng)目的正常、順利開展,特制定安保從業(yè)人員的業(yè)務(wù)技能及個(gè)人素質(zhì)的培訓(xùn)計(jì)劃編碼序列的計(jì)劃 第五章字典技術(shù) 概論 在之前的兩章,我們看見,假設(shè)產(chǎn)生一系列獨(dú)立字符的信源的編碼技術(shù)。由于大多數(shù)信源在開始時(shí)都是相關(guān)的,編碼步驟通常在解相關(guān)步驟之前。在本章中,我們將著眼于把結(jié)構(gòu)融合到數(shù)據(jù)的技術(shù),以增加其壓縮量。這些技術(shù)—靜態(tài)和自適應(yīng)的—建立了經(jīng)常出現(xiàn)的模式列表,并通過發(fā)送在列表中它們對(duì)應(yīng)的索引來編碼這些模式。對(duì)于產(chǎn)生相當(dāng)頻繁的相對(duì)小模式的信源,它們是最有用的,諸如文字源和計(jì)算機(jī)命令。我們討論了
2、的文本壓縮,現(xiàn)代通信和圖像壓縮的應(yīng)用。 介紹 在許多應(yīng)用中,信源的輸出包括了再生格式。一個(gè)典型的例子是一個(gè)文本源中的某些格式或字不斷地復(fù)發(fā)。另外,還有一些特定的格式根本就不會(huì)發(fā)生,或者如果他們發(fā)生,那也發(fā)生得很稀少。例如,我們可以確信這個(gè)詞Limpopo!在存在的文本源中發(fā)生在一個(gè)非常小的部分。目的-通過該培訓(xùn)員工可對(duì)保安行業(yè)有初步了解,并感受到安保行業(yè)的發(fā)展的巨大潛力,可提升其的專業(yè)水平,并確保其在這個(gè)行業(yè)的安全感。為了適應(yīng)公司新戰(zhàn)略的發(fā)展,保障停車場(chǎng)安保新項(xiàng)目的正常、順利開展,特制定安保從業(yè)人員的業(yè)務(wù)技能及個(gè)人素質(zhì)的培
3、訓(xùn)計(jì)劃 一個(gè)非常合理的方法來編碼這種信源就是把頻繁發(fā)生的格式保持為一個(gè)列表,或者字典。當(dāng)這些格式出現(xiàn)在源輸出時(shí),它們通過字典的一個(gè)參考被編碼。如果模式?jīng)]有出現(xiàn)在字典中,然后它可以使用一些其他低效率的方法進(jìn)行編碼。實(shí)際上,我們把輸入分割為兩大類,頻繁出現(xiàn)的格式和不常發(fā)生的格式.對(duì)于頻繁類出現(xiàn)的模式,這種技術(shù)是有效的,因此,字典的大小必須遠(yuǎn)小于所有可能格式的數(shù)目?! 〖僭O(shè)我們有一個(gè)特定的文本,它由四個(gè)字符,26個(gè)小寫的英文字母和后面的標(biāo)點(diǎn)符號(hào)的三個(gè)字符組成。假設(shè)我們的源字母表由26個(gè)小寫英文字母和之后的標(biāo)點(diǎn)符號(hào)—逗號(hào),句號(hào),感嘆
4、號(hào),問號(hào),分號(hào)和冒號(hào)組成。換言之,輸入字母表的大小為32。如果我們一次可以編碼文本源的一個(gè)符號(hào),同樣的方式處理可能的事件,我們將需要每字符5位。處理所有同樣可能的32^4四個(gè)字符的模式,我們有一個(gè)分配20位代碼到每四個(gè)字符模式的符號(hào)。現(xiàn)在,讓我們把256種最有可能的四個(gè)字符模式轉(zhuǎn)換成字典。轉(zhuǎn)換原則如下所示:每當(dāng)我們想發(fā)送在字典中已存在的模式,我們將發(fā)送一個(gè)1-位的標(biāo)志,也就是說,在由一個(gè)8位的指數(shù)所對(duì)應(yīng)字典的條目后發(fā)出一個(gè)0。如果這個(gè)模式不在字典中,我們將在20位編碼的格式后發(fā)出一個(gè)1。如果我們遇到的模式不在字典中,我們實(shí)際上
5、將使用比原來的計(jì)劃更多的比特,是21個(gè)而不是20。但是,如果它在字典中,我們僅僅發(fā)送9位。我們的方案實(shí)用性將取決于我們遇到的字在字典中所占的百分比。我們可以通過計(jì)算每個(gè)模式的平均比特?cái)?shù)來了解關(guān)于我們的計(jì)劃的效用。如果從字典中遇到一個(gè)格式的概率為p,則每個(gè)格式R的平均比特?cái)?shù)由下式給出:目的-通過該培訓(xùn)員工可對(duì)保安行業(yè)有初步了解,并感受到安保行業(yè)的發(fā)展的巨大潛力,可提升其的專業(yè)水平,并確保其在這個(gè)行業(yè)的安全感。為了適應(yīng)公司新戰(zhàn)略的發(fā)展,保障停車場(chǎng)安保新項(xiàng)目的正常、順利開展,特制定安保從業(yè)人員的業(yè)務(wù)技能及個(gè)人素質(zhì)的培訓(xùn)計(jì)劃 R=9
6、p+21(1-p)=21-12p.【】 對(duì)于這個(gè)等式很有用。當(dāng)p>=發(fā)生時(shí),R的值應(yīng)該小于20.這看起來不像一個(gè)很大的數(shù)。然而,注意到,如果以相同的方式發(fā)生,從字典中遇到一個(gè)格式的概率將小于!我們不只是希望有一個(gè)以同樣可能的方法進(jìn)行編碼的,略好于頭腦簡(jiǎn)單的方法編碼的方案,我們想盡可能多的提高性能。為了要做到這一點(diǎn),p應(yīng)該盡可能的大。這意味著,我們應(yīng)該慎重地選擇最有可能出現(xiàn)在字典條目的模式。要做到這一點(diǎn),我們必須有一個(gè)源輸出結(jié)構(gòu)的不錯(cuò)的主意。如果對(duì)于我們沒有這些可用的信息優(yōu)于這樣一個(gè)特定的源輸出的編碼,當(dāng)我們?cè)诰幋a的時(shí)候,我們
7、需要以某種方式獲得這些信息。如果我們覺得我們有足夠的先驗(yàn)知識(shí),我們可以使用一個(gè)靜態(tài)的方法,如果沒有,我們可以采取一種自適應(yīng)性的方法。我們將在本章看到這兩種方法?! §o態(tài)字典目的-通過該培訓(xùn)員工可對(duì)保安行業(yè)有初步了解,并感受到安保行業(yè)的發(fā)展的巨大潛力,可提升其的專業(yè)水平,并確保其在這個(gè)行業(yè)的安全感。為了適應(yīng)公司新戰(zhàn)略的發(fā)展,保障停車場(chǎng)安保新項(xiàng)目的正常、順利開展,特制定安保從業(yè)人員的業(yè)務(wù)技能及個(gè)人素質(zhì)的培訓(xùn)計(jì)劃 當(dāng)相當(dāng)多的信源先驗(yàn)知識(shí)可用時(shí),選擇一個(gè)靜態(tài)字典的技術(shù)是最合適的。此技術(shù)是特別適合于在特定的應(yīng)用程序中使用。例如,如果該
8、任務(wù)壓縮了一所大學(xué)的學(xué)生記錄,靜態(tài)字典的方法可能是最好的。這是因?yàn)槲覀兲崆爸滥承┰~,如“名稱”和“學(xué)號(hào)”,會(huì)出現(xiàn)在幾乎所有的記錄里。其他詞,如“大二”,“學(xué)分”等,也經(jīng)常會(huì)出現(xiàn)。根據(jù)大學(xué)的不同的位置,社會(huì)安全號(hào)碼中的某些數(shù)字更有可能發(fā)生。例如,在內(nèi)布拉斯加州,大部分學(xué)生的學(xué)