資源描述:
《多值屬性和多標記數(shù)據(jù)分類》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、分類號——UDC——1736051密級——編號——卡I匆大·學CENTRALSOUTHUNIVERSITY碩.士學位論文論文題目:壘笪星:睦盤多盤坦塑握僉耋學科、專業(yè):焦!墾生通焦三堡研究生姓名:鄞叢焦導師姓名及專業(yè)技術(shù)職務(wù):奎塞塾撞jf,j√_iMulti..valuedandMulti..1abeledDataClassificationSpeciality:.InformationandCommunicationEngineering—MasterDegreeCandidate:.Q墮Q№曼=ji壘nSupe
2、rvisor:£!Q魚墨曼Q!LiHQng..SchoolofInformationSciCentralSouthChangsha,Huna原創(chuàng)性聲明本人聲明,所呈交的學位論文是本人在導師指導下進行的研究工作及取得的研究成果。盡我所知,除了論文中特別加以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得中南大學或其他單位的學位或證書而使用過的材料。與我共同工作的同志對本研究所作的貢獻均已在論文中作了明確的說明。作者簽名:樾日期:趁坦年』月絲日學位論文版權(quán)使用授權(quán)書本人了解中南大學有關(guān)保
3、留、使用學位論文的規(guī)定,即:學校有權(quán)保留學位論文并根據(jù)國家或湖南省有關(guān)部門規(guī)定送交學位論文,允許學位論文被查閱和借閱;學校可以公布學位論文的全部或部分內(nèi)容,可以采用復印、縮印或其它手段保存學位論文。同時授權(quán)中國科學技術(shù)信息研究所將本學位論文收錄到《中國學位論文全文數(shù)據(jù)庫》,并通過網(wǎng)絡(luò)向社會公眾提供信息服務(wù)。作者簽名:壟膽導師簽名紐日期作者簽名:壟越導師簽名三塹紅日期摘要隨著計算機技術(shù)、網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)的迅速發(fā)展,現(xiàn)實中越來越多的應(yīng)用都與多值屬性、多標記數(shù)據(jù)密切相關(guān),因此多值屬性和多標記數(shù)據(jù)的分類算法成為了當前數(shù)
4、據(jù)挖掘和機器學習領(lǐng)域的一個研究熱點。目前的研究主要集中于多標記數(shù)據(jù)的分類算法,沒有考慮多值屬性的問題,而且大多數(shù)算法沒有充分學習標記之間的相關(guān)信息,加上現(xiàn)實中多樣本的數(shù)量少、標記困難等問題,對傳統(tǒng)的分類算法提出很多新的挑戰(zhàn)。本文的主要工作分為3個部分:(1)提出5種多值屬性分解算法,結(jié)合已有的多標記分類算法,建立多值屬性多標記分類的學習框架,并通過實驗比較了不同分解算法的優(yōu)劣,驗證了按照取值順序進行分解的學習效果最好;(2)改進已有的貝葉斯網(wǎng)絡(luò)算法,提出了結(jié)合通用貝葉斯網(wǎng)絡(luò)GBN和多網(wǎng)貝葉斯網(wǎng)絡(luò)MBN的多標記學習算
5、法,能夠有效獲取多個標記之間的相關(guān)信息,較大地提高了分類的精度;(3)針對多標記數(shù)據(jù)標記樣本少的問題,結(jié)合實際對基于多標記組合算法的缺點進行了深入分析,建立多標記組合的分層模型,并提出基于不確定度的主動學習和基于置信度的半監(jiān)督學習,交替選擇最有效的樣本進行學習,最終建立分層多標記分類器模型,實驗驗證了該方法能夠大大提高多標記分類器的有效性和魯棒性。本文的研究成果為學習多標記之間的相關(guān)信息以及在少量標記樣本下的多標記分類學習提供了有效的方法,并通過結(jié)合多值屬性分解的算法,為多值屬性多標記數(shù)據(jù)的分類建立了新的學習框架。
6、關(guān)鍵詞多值屬性分解,多標記分類,分層模型,貝葉斯網(wǎng)絡(luò)ABSTRACTWiththerapiddevelopmentofcomputertechnology,internetanddatabasesystem,moreandmoreapplicationsarecombinedwithmulti.valuedandmulti.1abeleddatasets.Hence,multi.valuedandmulti.1abeledclassificationhasbecomeahottopicforresearchersi
7、ndataminingandmachinelearning.Atpresent,mostoftheexistingresearchesaredoneonmulti.1abeledclassificationwithoutconsiderationaboutmulti.valuedproblem.Meanwhile,thecorrelationsbetweendifferentlabelsarenotstudiedadequately.Mlatismore.1ackoflabeledsampleresuksinins
8、u伍cientinformationtolearnduringthetrainingstage.Allthesearisenewchallengestotraditionalclassifiers.Therearethreecontributionsofthisthesis.Firstly,itputsforwardanewlearningfi'amewor