資源描述:
《基于主動學習的多示例多標簽學習算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、?、、廣東工業(yè)大學碩±學位論文(工程碩±)基于主動學習的多示例多標簽學習算法硏究李杰龍???-'■--?!牐?;.-—一.‘‘.。.,.-■'''.y--乂-././1'/'V.;-r.''r.-二o—六年五月.-?'.1.'■‘典-I''■-.^y.-:.戶I;六學校代號分類號::1巧45UDC;密級;學號:2。?;埃叮罚崳姀V東工業(yè)大學碩±學位論文(工
2、程碩±)基于主動學習的多示例多標簽學習算法研究李杰龍校內導師姓名、職稱:肖燕珊副教授校外導師姓名、職稱:盧宇高級工程師學科:(專業(yè))或領域名稱計算機技術學生所屬學院;計算機學院—論文答辯日期;二〇六年五月ADissertationSubmited化GuangdongUnive巧itofTechnoloforygytheDereeofMastergMasterofEngineerin(g)Resea--rchonMultiinstance
3、MultilabelActiveLearningAlgorithmsCandidate;LiJielongSupervisor:XiaoYanshanMa20y化SchoolofComputerScienceandTechnologyGuangdongUniversityofTechnologyGuangzhou,Guangdong,P.R.China,510006摘要摘要隨著互聯(lián)網(wǎng)的快速發(fā)展,,數(shù)碼產品的快速普及網(wǎng)頁文本和圖
4、像信息呈爆炸式增一長,數(shù)據(jù)的大小和數(shù)據(jù)的結構復雜度也在不斷提贏這些數(shù)據(jù)往往不具有唯的語義一>,語義的學習框架難1而是多義性的。由于這樣的多義性使得當前只考慮單[^取得良好的效果一。多示例多標簽學習解決的是真實世界中對象多義性問題的種學習框架,真實世界中的對象可W很容易采用多示例多標簽學習來進斤建模,多示例多標簽學習也成為近年來新的研巧熱點。在海量的數(shù)據(jù)中,面對少量有標簽數(shù)據(jù)和,僅有少量的數(shù)據(jù)是具有標簽和描述的一大量無標簽數(shù)據(jù),主動學習能夠在分類器學習的過程中,根據(jù)定的選擇策略,迭代
5、,并置入訓練集中進行學習主動地選擇對分類器性能改善最大的樣本進行標注,從而有效地提高了樣本訓練的效率。在同等條件下,使用更少的有標簽樣本,達到更高的分類精度,改善分類器的性能。本文首次把主動學習應用到多示例多標簽學習框架上,提出了多示例多標簽主動學習框架,yA及研。本文首先介紹了相關的學習算法巧了多示例多標簽學習的退化策略和主動學習的樣本選擇算法。然后結合多示例多標簽學習的特點,把多示例多標簽學習退化到多個單標簽的多示例學習。針對多個分類器,我們利用標注樣本和未標注一樣本的信
6、息,提出種衡量分類器的評價標準分類器可信度classifierconfidence。()根據(jù)多示例單標簽學習的特點,我們把主動學習應用到其中,并引入兩種不同級別的多示例學習算法作為我們的分類器模型一一,提出了兩種分類距離標簽最小分類距離(labelnrinimum出stance)和標簽平均分類距離(labelaveragedistance)。在此基礎上,我們設計了四種不同的主動學習樣本選擇策略算法。最后,我們將模型應用到自然場景一圖像分類和文本分類中,實驗結果表明般的樣本隨機選擇策
7、略,本文提出的方法與對比,在訓練樣本相同的情況下,本文提出的方法在各項評價指標中能夠獲得更好的分類性能。關巧詞:主動學習;多示例多標簽學習;自然場景分類;分本分類IAbstractAbstractWiththerapiddevelopmentoftheInternetandtherapidspreadofdigitalproducts,thetextandimaeinformationinthewebaesrowsexlosivel.
8、Thestructuralcomlexitgpggpypy’anddatasizealsocontinues化increase.Thisdataoftendoesnthavetheonlysemanticmeaningbutalsomultilesemanticmeaninsandambiuous.Hiisambiuitymakesa