資源描述:
《基于評(píng)論分析的協(xié)同過(guò)濾推薦算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、碩士學(xué)位論文題目:基于評(píng)論分析的協(xié)同過(guò)濾推薦算法研究研究生穆云磊專業(yè)計(jì)算機(jī)軟件與理論指導(dǎo)教師俞東進(jìn)教授完成日期2016年3月杭州電子科技大學(xué)碩士學(xué)位論文基于評(píng)論分析的協(xié)同過(guò)濾推薦算法研究研究生:穆云磊指導(dǎo)教師:俞東進(jìn)教授2016年3月DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterResearchonCollaborativeFilteringRecommenderSystemBasedonReviewAnalysisCa
2、ndidate:MuYunleiSupervisor:Prof.YuDongjinMarch,2016杭州電子科技大學(xué)學(xué)位論文原創(chuàng)性聲明巧使用授權(quán)說(shuō)明原創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果。除文中己經(jīng)注明引用的內(nèi)容外,本論文不含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫過(guò)的作商或成果。對(duì)本文的研巧做出重要貢獻(xiàn)的個(gè)人和集體,巧己在丈中W明碗方式標(biāo)明。一申請(qǐng)學(xué)位論文與資料若有不實(shí)么處,本人承擔(dān)切相關(guān)責(zé)任。論文作者簽名:曰期:>/居年3月
3、曰?學(xué)位論文使用授權(quán)說(shuō)明本人完全了解杭州電子科技大學(xué)關(guān)于保留和使用學(xué)位論文的規(guī)定,目P:研巧生在校攻讀學(xué)位期間論文工作的知巧產(chǎn)權(quán)單位屬杭州電子科技大學(xué)。本人保證。畢業(yè)離校后,發(fā)表論文或使用論文工作成果時(shí)署名單位仍然為杭州電子料技大學(xué)學(xué)校有權(quán)保留送交論文的復(fù)印件,允許查閱和借閱論文;學(xué)校可公布論文的全部或部分內(nèi)容,可允許采用影印、縮印或其它復(fù)制手段保存論文。(保密論文在解密后遵守此規(guī)定)論文作者簽名:曰期:/年月曰和6^^"*?^/去指導(dǎo)教師簽名:日期:年3月曰/^
4、^^?^杭州電子科技大學(xué)碩士學(xué)位論文摘要個(gè)性化推薦系統(tǒng)可以幫助用戶在海量的項(xiàng)目集合中找到他們喜愛(ài)的項(xiàng)目,其被廣泛地應(yīng)用于電子商務(wù)網(wǎng)站、在線內(nèi)容提供平臺(tái)以及社交網(wǎng)絡(luò)平臺(tái)中,并成為這些網(wǎng)站提升服務(wù)質(zhì)量的重要技術(shù)之一。其中,協(xié)同過(guò)濾方法是最成功的推薦方法之一。利用集體智慧的思想,協(xié)同過(guò)濾可以產(chǎn)生精確的個(gè)性化推薦。然而,傳統(tǒng)的協(xié)同過(guò)濾推薦系統(tǒng)面臨著數(shù)據(jù)稀疏和冷啟動(dòng)問(wèn)題,即,當(dāng)用戶、產(chǎn)品的交互信息非常稀疏時(shí),協(xié)同過(guò)濾算法常常會(huì)失效。近年來(lái),隨著在線用戶反饋信息的爆炸性增長(zhǎng),伴隨著評(píng)論的評(píng)分反饋也越來(lái)越豐富。這些評(píng)論包
5、含著用戶和項(xiàng)目豐富的信息。本文通過(guò)對(duì)評(píng)論文本的分析,提出了兩個(gè)改進(jìn)的評(píng)分預(yù)測(cè)方法,在數(shù)據(jù)稀疏和冷啟動(dòng)的情況下,顯著提高了評(píng)分預(yù)測(cè)的精度。第一,本文提出了一個(gè)基于文檔向量和回歸模型的評(píng)分預(yù)測(cè)框架,它利用文檔向量表示模型將非結(jié)構(gòu)化的評(píng)論文本用相同維度的向量表示,進(jìn)而構(gòu)造出刻畫用戶和產(chǎn)品的特征向量,并使用這些向量和用戶與產(chǎn)品的偏置一同構(gòu)造用戶-產(chǎn)品對(duì)特征實(shí)例集,最終融合多個(gè)回歸模型進(jìn)行評(píng)分預(yù)測(cè)。框架使用文檔向量模型,為用戶-產(chǎn)品對(duì)構(gòu)造了較為精確的特征空間,并利用高效的回歸模型,使得其數(shù)據(jù)稀疏時(shí)的評(píng)分預(yù)測(cè)精度顯著地
6、優(yōu)于傳統(tǒng)的協(xié)同過(guò)濾方法。第二,本文提出了一個(gè)基于方面情感統(tǒng)一模型(ASUM)的潛在因子作為主題(HFT)的擴(kuò)展模型:評(píng)分即情感(RAS)模型。由于文本評(píng)論中不僅包含了用戶對(duì)產(chǎn)品的不同方面的關(guān)注情況,還包含了對(duì)特定產(chǎn)品具體方面的情感,這些情感在很大程度上影響了用戶的評(píng)分。因此,RAS將用戶在評(píng)論中表達(dá)的情感與評(píng)分相關(guān)聯(lián),相比于基準(zhǔn)模型,它能夠?qū)W習(xí)更加精確的用戶和產(chǎn)品的潛在因子。在基于真實(shí)的數(shù)據(jù)集上的實(shí)驗(yàn)表明,本文提出的兩個(gè)方法顯著改善了數(shù)據(jù)稀疏的情況下評(píng)分預(yù)測(cè)的準(zhǔn)確性。關(guān)鍵字:推薦系統(tǒng),協(xié)同過(guò)濾,數(shù)據(jù)稀疏,評(píng)
7、論文本,評(píng)分預(yù)測(cè)I杭州電子科技大學(xué)碩士學(xué)位論文AbstractRecommendersystemstypicallyproducealistofrecommendationstopreciselypredicttheuser'spreferencefortheitems.Itiswidelyusedine-commercewebsites,onlinecontentprovidersandsocialnetworkandbecomesoneofthemostimportanttechniquestoimpr
8、ovetheservicequalityofthesewebsites.Inrecentyears,CollaborativeFiltering(CF)isoneofthemostsuccessfulrecommendingmethods.Usingtheideasofcollectiveintelligence,CFisabletoproducepreciserecommendationsforusers.Ho