多標(biāo)記維度約減和分類算法研究

多標(biāo)記維度約減和分類算法研究

ID:33091930

大小:980.21 KB

頁數(shù):57頁

時(shí)間:2019-02-20

多標(biāo)記維度約減和分類算法研究_第1頁
多標(biāo)記維度約減和分類算法研究_第2頁
多標(biāo)記維度約減和分類算法研究_第3頁
多標(biāo)記維度約減和分類算法研究_第4頁
多標(biāo)記維度約減和分類算法研究_第5頁
資源描述:

《多標(biāo)記維度約減和分類算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、多標(biāo)記維度約減和分類算法研究重慶大學(xué)碩士學(xué)位論文(學(xué)術(shù)學(xué)位)學(xué)生姓名:燕凱指導(dǎo)教師:唐朝偉教授專業(yè):通信與信息系統(tǒng)學(xué)科門類:工學(xué)重慶大學(xué)通信工程學(xué)院二O一四年六月ResearchontheDimensionalityReductionandClassificationAlgorithmsinMulti-LabelLearningAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheMaster’sDegreeofEngineeringByKaiYanSupervisedbyProf.Cha

2、oweiTangSpecialty:CommunicationandInformationSystemCollegeofCommunicationEngineeringofChongqingUniversity,Chongqing,ChinaJune,2014重慶大學(xué)碩士學(xué)位論文中文摘要摘要多標(biāo)記學(xué)習(xí)來源于文本分類問題的研究,現(xiàn)實(shí)生活中很多基于機(jī)器學(xué)習(xí)的問題都可以看作是多標(biāo)記學(xué)習(xí)。傳統(tǒng)監(jiān)督學(xué)習(xí)中每個(gè)示例僅僅具有單個(gè)標(biāo)記,但是多標(biāo)記學(xué)習(xí)中每個(gè)示例擁有多個(gè)標(biāo)記。為了提高多標(biāo)記學(xué)習(xí)中分類的準(zhǔn)確率,示例的大量原始特征被采集,導(dǎo)致輸入空間維數(shù)非常高,從而造成“維數(shù)災(zāi)難”問題。因此,如何從輸入空間的高維

3、特征向量中獲取有效的低維數(shù)據(jù),對(duì)于提高多標(biāo)記分類問題的準(zhǔn)確率有重要意義。本文的研究重點(diǎn)是多標(biāo)記分類中的維度約減算法和多標(biāo)記分類算法。本文主要工作內(nèi)容如下:(1)介紹多標(biāo)記學(xué)習(xí)、常見的維度約減算法和流形學(xué)習(xí)算法。流形學(xué)習(xí)算法能夠從高維特征向量數(shù)據(jù)中獲取低維流形結(jié)構(gòu),并且從高維特征向量數(shù)據(jù)映射到低維特征空間時(shí),能夠保留高維數(shù)據(jù)中局部鄰域間的相互關(guān)系。但是局部線性嵌入流形學(xué)習(xí)(LocallyLinearEmbedding,LLE)算法的近鄰點(diǎn)個(gè)數(shù)是固定的,不能剔除流形中的小規(guī)模結(jié)構(gòu)和不能避免將連續(xù)的流形分割為不相關(guān)的子流形。因此,如何選取近鄰點(diǎn)個(gè)數(shù)成為一個(gè)重要的問題。(2)研究了在已標(biāo)記數(shù)據(jù)比較少

4、但是未標(biāo)記數(shù)據(jù)大量存在的場(chǎng)景下,多標(biāo)記分類正確率不高的問題。由于實(shí)際場(chǎng)景中輸入空間的高維特征向量數(shù)據(jù)僅有少量被標(biāo)記,大部分?jǐn)?shù)據(jù)都沒有標(biāo)記。為了有效去除冗余特征并使用大量未標(biāo)記樣本所提供的潛在信息,需要使用半監(jiān)督學(xué)習(xí)方法。為了能夠利用類別已知的示例的監(jiān)督信息,又利用大量類別未知的示例的統(tǒng)計(jì)信息進(jìn)行維度約減;并且確定合適的近鄰點(diǎn)個(gè)數(shù),本文提出一種可變K近鄰半監(jiān)督局部線性嵌入流形維度約減算法(VariableK-NearestSemi-SupervisedLocallyLinearEmbedding,VKSSLLE)。(3)探討多標(biāo)記分類問題中出現(xiàn)的數(shù)據(jù)分類性能不理想的問題,并提出一種基于VKSS

5、LLE維度約減算法的多標(biāo)記樸素貝葉斯分類算法。該方法通過使用可變K近鄰半監(jiān)督流形學(xué)習(xí)算法進(jìn)行維度約減,并引入樸素貝葉斯分類器進(jìn)行多標(biāo)記分類,從而提高多標(biāo)記分類的準(zhǔn)確率。利用不同維度約減算法與樸素貝葉斯分類器相結(jié)合,作用于不同的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),結(jié)果表明基于VKSSLLE維度約減算法的多標(biāo)記樸素貝葉斯分類算法能夠更好地提高多標(biāo)記分類的準(zhǔn)確率。關(guān)鍵字:多標(biāo)記分類,多標(biāo)記維度約減,樸素貝葉斯分類器,流形學(xué)習(xí),半監(jiān)督學(xué)習(xí)I重慶大學(xué)碩士學(xué)位論文英文摘要ABSTRACTMulti-labellearningcomesfromtextclassification,andmanyreal-worldprobl

6、emsbasedonmachinelearningfallintothecategoryofmulti-labellearning.Differentfromtraditionalsupervisedlearningmethodswhichassumethateachinstanceisassociatedwithonlyoneclasslabel,oneinstanceinmulti-labellearningusuallybelongstomultiplelabelssimultaneously.Numerousoriginalfeaturesshouldbesampledtoenhan

7、cetheaccuracyofmulti-labellearning,whichresultsin‘curseofdimensionality’problem.Theaccuracyoflearningalgorithmswillbeseverelydegeneratedduetothisproblem.Thus,howtoobtaineffectivelow-dimensionaldatafromhigh-

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。