基于多變量信息瓶頸的多特征聚類算法

基于多變量信息瓶頸的多特征聚類算法

ID:33978089

大?。?.72 MB

頁數(shù):51頁

時間:2019-03-03

基于多變量信息瓶頸的多特征聚類算法_第1頁
基于多變量信息瓶頸的多特征聚類算法_第2頁
基于多變量信息瓶頸的多特征聚類算法_第3頁
基于多變量信息瓶頸的多特征聚類算法_第4頁
基于多變量信息瓶頸的多特征聚類算法_第5頁
資源描述:

《基于多變量信息瓶頸的多特征聚類算法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫

1、AthesissubmittedtoZhengzhouUniversityforthedegreeofMasterMulti—featureClusteringbasedonMultivariateInformationBottleneckMethodByXiaoqiangYanSupervisor:Prof.YangdongYeComputerSoftwareandTheorySchoolofInformationEngineeringMay2014原創(chuàng)性聲明本人鄭重聲明:所呈交的學位論文,是本人在導師的指導下,獨立進行研究所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外

2、,本論文不包含任何其他個人或集體己經(jīng)發(fā)表或撰寫過的科研成果。對本文的研究作出重要貢獻的個人和集體,均已在文中以明確方式標明。本聲明的法律責任由本人承擔。學位論文作者:c司小弓雖魄力,忙f月石日學位論文使用授權(quán)聲明本人在導師指導下完成的論文及相關(guān)的職務(wù)作品,知識產(chǎn)權(quán)歸屬鄭州大學。根據(jù)鄭州大學有關(guān)保留、使用學位論文的規(guī)定,同意學校保留或向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱;本人授權(quán)鄭州大學可以將本學位論文的全部或部分編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或者其他復(fù)制手段保存論文和匯編本學位論文。本人離校后發(fā)表、使用學位論文或與該學位論文

3、直接相關(guān)的學術(shù)論文或成果時,第一署名單位仍然為鄭州大學。保密論文在解密后應(yīng)遵守此規(guī)定。?一:閉小獨日期:勱燁年f月以日摘要多變量信息瓶頸(MultivariateInformationBottleneck)方法是基于信息論的一種多元數(shù)據(jù)處理方法,此方法能夠處理數(shù)據(jù)壓縮與信息保存之問的平衡,有效地發(fā)現(xiàn)數(shù)據(jù)中蘊含的多種潛在模式,解決復(fù)雜優(yōu)化問題中算法精度與效率之間的平衡問題。然而,多變量信息瓶頸方法在做數(shù)據(jù)分析時僅考慮數(shù)據(jù)的一種相關(guān)變量,忽略其它多種重要的特征信息,使抽取得到的數(shù)據(jù)模式中包含單獨特征帶來的偏見。針對上述問題,本文在多變量信息瓶頸方法的基礎(chǔ)上提出了一種同時

4、處理數(shù)據(jù)多種特征的聚類算法:mf-MIB算法。該算法采用提?。喜⒉呗?,在對數(shù)據(jù)進行聚類分析的過程中能夠同時考慮多種特征信息,為多種特征處理問題提供了一種有效的解決方法。同時,mf-M1B算法能夠?qū)W習特征與對應(yīng)的視覺單詞之間的語義相關(guān)性,緩解語義鴻溝問題對聚類算法的限制。在圖像數(shù)據(jù)集和視頻數(shù)據(jù)集上的實驗結(jié)果表明:mf-MIB算法能夠有效處理數(shù)據(jù)中蘊含的多種特征信息,算法性能優(yōu)于原lB算法;相比于k-means算法、NCuts算法和PLSA算法,mf-M1B算法得到更高的聚類精度和標準化互信息,優(yōu)勢明顯;此外,mf-MIB算法能夠有限迭代次數(shù)內(nèi)有效地收斂到一個局部最優(yōu)

5、解。本文提出的mf-MIB算法可應(yīng)用于聚類分析、模式識別、信息檢索等領(lǐng)域,并且實驗結(jié)果表明其能得到高質(zhì)量的聚類結(jié)果。此外,本文提出的mf-MIB算法比原IB算法適用更多種類的數(shù)據(jù)集,為IB方法提供了一個新的研究思路。關(guān)鍵詞:多變量信息瓶頸,多特征,互信息,聚類分析AbstractMultivariateInformationBottleneck(MIB)isamultipledataanalysismethodbasedoninformationtheory,whichcandetectavarietyofpotentialpatternsandfindasolut

6、iontocomplexproblembybalancingtherelationshipbetweendatacompressionandinformationpreservation.However,MIBmethodfbcusesontheextractionofmultiplecompressionpatternsandconsidersonlyonerelevantvariable.whichignoresdiversecharacteristicinformationcontainedintheSOUrcedata.Sothedataanalysisre

7、sultswillembodyprejudiceproducedbyasinglefeature.Inresponsetotheaboveproblems,thispaperproposesanovelandefrectivemultiplefeaturesclusteringalgorithmbasedonmultivariateIBmethod:mfMIBalgorithm,whichcanprocessmultiplefeaturesbyadopting‘draw.a(chǎn)nd.merge,strategy.mf-MIBmethodcantakemultiple

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。