資源描述:
《多標(biāo)記學(xué)習(xí)算法及其在標(biāo)簽推薦中應(yīng)用研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、劣參未)
2、p/一,l碩士學(xué)位論文多標(biāo)記學(xué)習(xí)算法及其在標(biāo)簽推薦中應(yīng)用研究ResearchonMulti--labelLearningAlgorithmsandApplicationstoTagRecommendations作者:何穎婧導(dǎo)師:王志海北京交通大學(xué)2014年3月學(xué)位論文版權(quán)使用授權(quán)書fIIIIIIIUUIIlllIY2603502本學(xué)位論文作者完全了解北京交通大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定.特授權(quán)北京交通大學(xué)可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,提供閱覽服務(wù),并采用影印、縮印或掃描等復(fù)制手段保存、匯編以供查閱和借閱.同意學(xué)校向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和磁盤.
3、(保密的學(xué)位論文在解密后適用本授權(quán)說明)學(xué)位論文作者簽名:4百潁嫡簽字日期:wI炒年p3月12日導(dǎo)師簽名:∑等蟛。簽字日期:細(xì),爭年多月/妒日中圖分類號:TPl81UDC:004.8北京交通大學(xué)碩士學(xué)位論文學(xué)校代碼:10004密級:公開多標(biāo)記學(xué)習(xí)算法及其在標(biāo)簽推薦中應(yīng)用研究ResearchonMulti—labelLearningAlgorithmsandApplicationstoTagRecommendations作者姓名:何穎婧導(dǎo)師姓名:王志海學(xué)位類別:工學(xué)學(xué)科專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)學(xué)號:11120442職稱:教授學(xué)位級別:碩士研究方向:數(shù)據(jù)挖掘北京交通大學(xué)2014年3月致謝本論文的工作
4、是在我的導(dǎo)師王志海教授的悉心指導(dǎo)下完成的,王志海教授嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度和科學(xué)的工作方法給了我極大的幫助和影響.在此衷心感謝三年來王志海老師對我的關(guān)心和指導(dǎo).瞿有利老師悉心指導(dǎo)我們完成了實(shí)驗(yàn)室的科研工作,在學(xué)習(xí)上和生活上都給予了我很大的關(guān)心和幫助,在此向瞿有利老師表示衷心的謝意.在實(shí)驗(yàn)室工作及撰寫論文期間,李哲、付彬、張培倩等同學(xué)對我論文中的研究工作給予了熱情幫助,在此向他們表達(dá)我的感激之情.在兩年半的研究生生活期間,張倩、卜夢醒、張康潔等同學(xué)對我的日常生活提供了極大的幫助,在此向她們表示真摯的感謝.另外也感謝家人,他們的理解和支持使我能夠在學(xué)校專心完成我的學(xué)業(yè).中文摘要信息技術(shù)的飛速發(fā)展帶來了信息
5、過載問題,它使用戶很難從海量的數(shù)據(jù)中獲取有用的信息.自動分類作為解決信息過載問題的有效手段,已經(jīng)在眾多領(lǐng)域得到廣泛應(yīng)用.傳統(tǒng)的分類都假設(shè)實(shí)例只與一個標(biāo)記相關(guān),而在類似文本、圖像、視頻等領(lǐng)域中,實(shí)例通常都與多個標(biāo)記相關(guān),傳統(tǒng)的分類算法也就不再適用,因此對多標(biāo)記數(shù)據(jù)的學(xué)習(xí)成為重要的研究課題.標(biāo)簽推薦則隨著標(biāo)簽網(wǎng)站的迅速發(fā)展成為熱門的研究問題之一.本文主要研究多標(biāo)記學(xué)習(xí)算法,并根據(jù)多標(biāo)記學(xué)習(xí)與標(biāo)簽推薦的預(yù)測結(jié)果都是多個元素的特點(diǎn),對多標(biāo)記學(xué)習(xí)算法在標(biāo)簽推薦中的應(yīng)用展開相關(guān)的研究.本文首先對多標(biāo)記學(xué)習(xí)與標(biāo)簽推薦的概念進(jìn)行闡述,分別總結(jié)了多標(biāo)記學(xué)習(xí)與標(biāo)簽推薦的相關(guān)算法,并分析了各算法的優(yōu)缺點(diǎn).其次,提出
6、了基于標(biāo)記間關(guān)系的多標(biāo)記學(xué)習(xí)算法,該算法對元級特征進(jìn)行了改進(jìn),改進(jìn)后的簡化元級特征保留了元級特征能夠表示實(shí)例與標(biāo)記的關(guān)系的特點(diǎn),同時減少了輸入空間的維度.在此基礎(chǔ)上,該算法提出結(jié)合簡化的元級特征以及標(biāo)記空間得到標(biāo)記間關(guān)系矩陣的方法,預(yù)測階段結(jié)合該矩陣與簡化的元級特征得到預(yù)測結(jié)果.在多標(biāo)記數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該算法能夠有效的利用標(biāo)記間的關(guān)系,且更適用于對標(biāo)記間依賴關(guān)系較強(qiáng)的數(shù)據(jù)集進(jìn)行分類.最后,根據(jù)標(biāo)簽推薦的特點(diǎn),對多標(biāo)記學(xué)習(xí)算法的部分實(shí)現(xiàn)進(jìn)行了改進(jìn),提出了用于標(biāo)簽推薦的多標(biāo)記學(xué)習(xí)算法.訓(xùn)練階段,提出了以標(biāo)簽共現(xiàn)次數(shù)來計(jì)算標(biāo)簽間關(guān)系矩陣的方法.推薦階段,提出了以標(biāo)簽向量來表示用戶與資源的歷史
7、信息,結(jié)合該標(biāo)簽向量與標(biāo)簽問關(guān)系矩陣得到推薦的標(biāo)簽集合.在標(biāo)簽數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該改進(jìn)算法相較于其他標(biāo)簽推薦算法,較好的利用了標(biāo)簽問關(guān)系,推薦的標(biāo)簽集合更準(zhǔn)確.關(guān)鍵詞:數(shù)據(jù)挖掘;分類;多標(biāo)記;推薦系統(tǒng);標(biāo)簽推薦分類號:TPl81ABSTRACTTherapiddevelopmentofinformationtechnologyhasbroughttheinformationoverloadproblem,whichresultsthatit’Shardforuserstogetusefulinformationfrommassivedata.Automaticclassification
8、iSoneoftheeffectivemeanstosolvetheproblemandithasbeenwidelyusedinmanyareas.Traditionalclassificationusuallyassumesthatinstancesareassociatedwimonlyonelabel.However,insomeareasinstancesareusuallyassoci