資源描述:
《基于多變量信息瓶頸的多特征聚類算法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、AthesissubmittedtoZhengzhouUniversityforthedegreeofMasterMulti—featureClusteringbasedonMultivariateInformationBottleneckMethodByXiaoqiangYanSupervisor:Prof.YangdongYeComputerSoftwareandTheorySchoolofInformationEngineeringMay2014原創(chuàng)性聲明本人鄭重聲明:所呈交的學位論文,是本人在導師的指導下,獨立進行研究所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外
2、,本論文不包含任何其他個人或集體己經(jīng)發(fā)表或撰寫過的科研成果。對本文的研究作出重要貢獻的個人和集體,均已在文中以明確方式標明。本聲明的法律責任由本人承擔。學位論文作者:c司小弓雖魄力,忙f月石日學位論文使用授權(quán)聲明本人在導師指導下完成的論文及相關(guān)的職務(wù)作品,知識產(chǎn)權(quán)歸屬鄭州大學。根據(jù)鄭州大學有關(guān)保留、使用學位論文的規(guī)定,同意學校保留或向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱;本人授權(quán)鄭州大學可以將本學位論文的全部或部分編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或者其他復(fù)制手段保存論文和匯編本學位論文。本人離校后發(fā)表、使用學位論文或與該學位論文
3、直接相關(guān)的學術(shù)論文或成果時,第一署名單位仍然為鄭州大學。保密論文在解密后應(yīng)遵守此規(guī)定。?一:閉小獨日期:勱燁年f月以日摘要多變量信息瓶頸(MultivariateInformationBottleneck)方法是基于信息論的一種多元數(shù)據(jù)處理方法,此方法能夠處理數(shù)據(jù)壓縮與信息保存之問的平衡,有效地發(fā)現(xiàn)數(shù)據(jù)中蘊含的多種潛在模式,解決復(fù)雜優(yōu)化問題中算法精度與效率之間的平衡問題。然而,多變量信息瓶頸方法在做數(shù)據(jù)分析時僅考慮數(shù)據(jù)的一種相關(guān)變量,忽略其它多種重要的特征信息,使抽取得到的數(shù)據(jù)模式中包含單獨特征帶來的偏見。針對上述問題,本文在多變量信息瓶頸方法的基礎(chǔ)上提出了一種同時
4、處理數(shù)據(jù)多種特征的聚類算法:mf-MIB算法。該算法采用提?。喜⒉呗?,在對數(shù)據(jù)進行聚類分析的過程中能夠同時考慮多種特征信息,為多種特征處理問題提供了一種有效的解決方法。同時,mf-M1B算法能夠?qū)W習特征與對應(yīng)的視覺單詞之間的語義相關(guān)性,緩解語義鴻溝問題對聚類算法的限制。在圖像數(shù)據(jù)集和視頻數(shù)據(jù)集上的實驗結(jié)果表明:mf-MIB算法能夠有效處理數(shù)據(jù)中蘊含的多種特征信息,算法性能優(yōu)于原lB算法;相比于k-means算法、NCuts算法和PLSA算法,mf-M1B算法得到更高的聚類精度和標準化互信息,優(yōu)勢明顯;此外,mf-MIB算法能夠有限迭代次數(shù)內(nèi)有效地收斂到一個局部最優(yōu)
5、解。本文提出的mf-MIB算法可應(yīng)用于聚類分析、模式識別、信息檢索等領(lǐng)域,并且實驗結(jié)果表明其能得到高質(zhì)量的聚類結(jié)果。此外,本文提出的mf-MIB算法比原IB算法適用更多種類的數(shù)據(jù)集,為IB方法提供了一個新的研究思路。關(guān)鍵詞:多變量信息瓶頸,多特征,互信息,聚類分析AbstractMultivariateInformationBottleneck(MIB)isamultipledataanalysismethodbasedoninformationtheory,whichcandetectavarietyofpotentialpatternsandfindasolut
6、iontocomplexproblembybalancingtherelationshipbetweendatacompressionandinformationpreservation.However,MIBmethodfbcusesontheextractionofmultiplecompressionpatternsandconsidersonlyonerelevantvariable.whichignoresdiversecharacteristicinformationcontainedintheSOUrcedata.Sothedataanalysisre
7、sultswillembodyprejudiceproducedbyasinglefeature.Inresponsetotheaboveproblems,thispaperproposesanovelandefrectivemultiplefeaturesclusteringalgorithmbasedonmultivariateIBmethod:mfMIBalgorithm,whichcanprocessmultiplefeaturesbyadopting‘draw.a(chǎn)nd.merge,strategy.mf-MIBmethodcantakemultiple