資源描述:
《多標記學習算法及其在標簽推薦中應用研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、劣參未)
2、p/一,l碩士學位論文多標記學習算法及其在標簽推薦中應用研究ResearchonMulti--labelLearningAlgorithmsandApplicationstoTagRecommendations作者:何穎婧導師:王志海北京交通大學2014年3月學位論文版權使用授權書fIIIIIIIUUIIlllIY2603502本學位論文作者完全了解北京交通大學有關保留、使用學位論文的規(guī)定.特授權北京交通大學可以將學位論文的全部或部分內容編入有關數據庫進行檢索,提供閱覽服務,并采用影印、縮印或掃描等復制手段保存、匯編以供查閱和借閱.同意學校向國家有關部門或機構送交論文的復印件和磁盤.
3、(保密的學位論文在解密后適用本授權說明)學位論文作者簽名:4百潁嫡簽字日期:wI炒年p3月12日導師簽名:∑等蟛。簽字日期:細,爭年多月/妒日中圖分類號:TPl81UDC:004.8北京交通大學碩士學位論文學校代碼:10004密級:公開多標記學習算法及其在標簽推薦中應用研究ResearchonMulti—labelLearningAlgorithmsandApplicationstoTagRecommendations作者姓名:何穎婧導師姓名:王志海學位類別:工學學科專業(yè):計算機科學與技術學號:11120442職稱:教授學位級別:碩士研究方向:數據挖掘北京交通大學2014年3月致謝本論文的工作
4、是在我的導師王志海教授的悉心指導下完成的,王志海教授嚴謹的治學態(tài)度和科學的工作方法給了我極大的幫助和影響.在此衷心感謝三年來王志海老師對我的關心和指導.瞿有利老師悉心指導我們完成了實驗室的科研工作,在學習上和生活上都給予了我很大的關心和幫助,在此向瞿有利老師表示衷心的謝意.在實驗室工作及撰寫論文期間,李哲、付彬、張培倩等同學對我論文中的研究工作給予了熱情幫助,在此向他們表達我的感激之情.在兩年半的研究生生活期間,張倩、卜夢醒、張康潔等同學對我的日常生活提供了極大的幫助,在此向她們表示真摯的感謝.另外也感謝家人,他們的理解和支持使我能夠在學校專心完成我的學業(yè).中文摘要信息技術的飛速發(fā)展帶來了信息
5、過載問題,它使用戶很難從海量的數據中獲取有用的信息.自動分類作為解決信息過載問題的有效手段,已經在眾多領域得到廣泛應用.傳統(tǒng)的分類都假設實例只與一個標記相關,而在類似文本、圖像、視頻等領域中,實例通常都與多個標記相關,傳統(tǒng)的分類算法也就不再適用,因此對多標記數據的學習成為重要的研究課題.標簽推薦則隨著標簽網站的迅速發(fā)展成為熱門的研究問題之一.本文主要研究多標記學習算法,并根據多標記學習與標簽推薦的預測結果都是多個元素的特點,對多標記學習算法在標簽推薦中的應用展開相關的研究.本文首先對多標記學習與標簽推薦的概念進行闡述,分別總結了多標記學習與標簽推薦的相關算法,并分析了各算法的優(yōu)缺點.其次,提出
6、了基于標記間關系的多標記學習算法,該算法對元級特征進行了改進,改進后的簡化元級特征保留了元級特征能夠表示實例與標記的關系的特點,同時減少了輸入空間的維度.在此基礎上,該算法提出結合簡化的元級特征以及標記空間得到標記間關系矩陣的方法,預測階段結合該矩陣與簡化的元級特征得到預測結果.在多標記數據集上的實驗結果表明,該算法能夠有效的利用標記間的關系,且更適用于對標記間依賴關系較強的數據集進行分類.最后,根據標簽推薦的特點,對多標記學習算法的部分實現進行了改進,提出了用于標簽推薦的多標記學習算法.訓練階段,提出了以標簽共現次數來計算標簽間關系矩陣的方法.推薦階段,提出了以標簽向量來表示用戶與資源的歷史
7、信息,結合該標簽向量與標簽問關系矩陣得到推薦的標簽集合.在標簽數據集上的實驗結果表明,該改進算法相較于其他標簽推薦算法,較好的利用了標簽問關系,推薦的標簽集合更準確.關鍵詞:數據挖掘;分類;多標記;推薦系統(tǒng);標簽推薦分類號:TPl81ABSTRACTTherapiddevelopmentofinformationtechnologyhasbroughttheinformationoverloadproblem,whichresultsthatit’Shardforuserstogetusefulinformationfrommassivedata.Automaticclassification
8、iSoneoftheeffectivemeanstosolvetheproblemandithasbeenwidelyusedinmanyareas.Traditionalclassificationusuallyassumesthatinstancesareassociatedwimonlyonelabel.However,insomeareasinstancesareusuallyassoci