資源描述:
《基于主動(dòng)學(xué)習(xí)的多示例多標(biāo)簽學(xué)習(xí)算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、?、、廣東工業(yè)大學(xué)碩±學(xué)位論文(工程碩±)基于主動(dòng)學(xué)習(xí)的多示例多標(biāo)簽學(xué)習(xí)算法硏究李杰龍???-'■--?!牐牐唬牐牎唬牐?。.,.-■'''.y--乂-././1'/'V.;-r.''r.-二o—六年五月.-?'.1.'■‘典-I''■-.^y.-:.戶(hù)I;六學(xué)校代號(hào)分類(lèi)號(hào)::1巧45UDC;密級(jí);學(xué)號(hào):2。?;埃叮罚崳姀V東工業(yè)大學(xué)碩±學(xué)位論文(工
2、程碩±)基于主動(dòng)學(xué)習(xí)的多示例多標(biāo)簽學(xué)習(xí)算法研究李杰龍校內(nèi)導(dǎo)師姓名、職稱(chēng):肖燕珊副教授校外導(dǎo)師姓名、職稱(chēng):盧宇高級(jí)工程師學(xué)科:(專(zhuān)業(yè))或領(lǐng)域名稱(chēng)計(jì)算機(jī)技術(shù)學(xué)生所屬學(xué)院;計(jì)算機(jī)學(xué)院—論文答辯日期;二〇六年五月ADissertationSubmited化GuangdongUnive巧itofTechnoloforygytheDereeofMastergMasterofEngineerin(g)Resea--rchonMultiinstance
3、MultilabelActiveLearningAlgorithmsCandidate;LiJielongSupervisor:XiaoYanshanMa20y化SchoolofComputerScienceandTechnologyGuangdongUniversityofTechnologyGuangzhou,Guangdong,P.R.China,510006摘要摘要隨著互聯(lián)網(wǎng)的快速發(fā)展,,數(shù)碼產(chǎn)品的快速普及網(wǎng)頁(yè)文本和圖
4、像信息呈爆炸式增一長(zhǎng),數(shù)據(jù)的大小和數(shù)據(jù)的結(jié)構(gòu)復(fù)雜度也在不斷提贏這些數(shù)據(jù)往往不具有唯的語(yǔ)義一>,語(yǔ)義的學(xué)習(xí)框架難1而是多義性的。由于這樣的多義性使得當(dāng)前只考慮單[^取得良好的效果一。多示例多標(biāo)簽學(xué)習(xí)解決的是真實(shí)世界中對(duì)象多義性問(wèn)題的種學(xué)習(xí)框架,真實(shí)世界中的對(duì)象可W很容易采用多示例多標(biāo)簽學(xué)習(xí)來(lái)進(jìn)斤建模,多示例多標(biāo)簽學(xué)習(xí)也成為近年來(lái)新的研巧熱點(diǎn)。在海量的數(shù)據(jù)中,面對(duì)少量有標(biāo)簽數(shù)據(jù)和,僅有少量的數(shù)據(jù)是具有標(biāo)簽和描述的一大量無(wú)標(biāo)簽數(shù)據(jù),主動(dòng)學(xué)習(xí)能夠在分類(lèi)器學(xué)習(xí)的過(guò)程中,根據(jù)定的選擇策略,迭代
5、,并置入訓(xùn)練集中進(jìn)行學(xué)習(xí)主動(dòng)地選擇對(duì)分類(lèi)器性能改善最大的樣本進(jìn)行標(biāo)注,從而有效地提高了樣本訓(xùn)練的效率。在同等條件下,使用更少的有標(biāo)簽樣本,達(dá)到更高的分類(lèi)精度,改善分類(lèi)器的性能。本文首次把主動(dòng)學(xué)習(xí)應(yīng)用到多示例多標(biāo)簽學(xué)習(xí)框架上,提出了多示例多標(biāo)簽主動(dòng)學(xué)習(xí)框架,yA及研。本文首先介紹了相關(guān)的學(xué)習(xí)算法巧了多示例多標(biāo)簽學(xué)習(xí)的退化策略和主動(dòng)學(xué)習(xí)的樣本選擇算法。然后結(jié)合多示例多標(biāo)簽學(xué)習(xí)的特點(diǎn),把多示例多標(biāo)簽學(xué)習(xí)退化到多個(gè)單標(biāo)簽的多示例學(xué)習(xí)。針對(duì)多個(gè)分類(lèi)器,我們利用標(biāo)注樣本和未標(biāo)注一樣本的信
6、息,提出種衡量分類(lèi)器的評(píng)價(jià)標(biāo)準(zhǔn)分類(lèi)器可信度classifierconfidence。()根據(jù)多示例單標(biāo)簽學(xué)習(xí)的特點(diǎn),我們把主動(dòng)學(xué)習(xí)應(yīng)用到其中,并引入兩種不同級(jí)別的多示例學(xué)習(xí)算法作為我們的分類(lèi)器模型一一,提出了兩種分類(lèi)距離標(biāo)簽最小分類(lèi)距離(labelnrinimum出stance)和標(biāo)簽平均分類(lèi)距離(labelaveragedistance)。在此基礎(chǔ)上,我們?cè)O(shè)計(jì)了四種不同的主動(dòng)學(xué)習(xí)樣本選擇策略算法。最后,我們將模型應(yīng)用到自然場(chǎng)景一圖像分類(lèi)和文本分類(lèi)中,實(shí)驗(yàn)結(jié)果表明般的樣本隨機(jī)選擇策
7、略,本文提出的方法與對(duì)比,在訓(xùn)練樣本相同的情況下,本文提出的方法在各項(xiàng)評(píng)價(jià)指標(biāo)中能夠獲得更好的分類(lèi)性能。關(guān)巧詞:主動(dòng)學(xué)習(xí);多示例多標(biāo)簽學(xué)習(xí);自然場(chǎng)景分類(lèi);分本分類(lèi)IAbstractAbstractWiththerapiddevelopmentoftheInternetandtherapidspreadofdigitalproducts,thetextandimaeinformationinthewebaesrowsexlosivel.
8、Thestructuralcomlexitgpggpypy’anddatasizealsocontinues化increase.Thisdataoftendoesnthavetheonlysemanticmeaningbutalsomultilesemanticmeaninsandambiuous.Hiisambiuitymakesa