資源描述:
《基于用戶評分和用戶特征的混合協(xié)同過濾算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分類編號:——密級:——單位代碼:—100—65學(xué)號:—12100—90005天滓3
2、幣苊大學(xué)研究生學(xué)位論文論文題目:基王且莊證盆塑旦應(yīng)掛塹絲濕金坯回過選篡法硒塞學(xué)生姓名:查連歪申請學(xué)位級別:亟±申請專業(yè)名稱:塾直這苤堂研究方向:麴據(jù)揎揭指導(dǎo)教師姓名:瑟掛薹專業(yè)技術(shù)職稱:塾拯提交論文日期:圣Q!晝生墨旦壘皇目天津師范大學(xué)碩士研究生論文原創(chuàng)性聲明本人聲明所呈交的論文是我個人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他入已經(jīng)發(fā)表或撰寫過的研究成果,也不
3、包含為獲得苤洼盟蕉盤堂或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示了謝意。論文作者簽名:印撕嗍彬年占月z日研究生學(xué)位論文使用授權(quán)說明(必須裝訂在提交學(xué)校圖書館的印刷本)本人完全了解天津師范大學(xué)關(guān)于收集、保存、使用研究生學(xué)位論文的規(guī)定,即:·按照學(xué)校要求向圖書館提交學(xué)位論文的印刷本和電子版本;·圖書館有權(quán)保存學(xué)位論文的EpJIilll本和電子版,并通過校園網(wǎng)向本校讀者提供全文與閱覽服務(wù)。·圖書館可以采用數(shù)字化或其它手段保存論文;·因某種特殊原
4、因需要延遲發(fā)布學(xué)位論文,按學(xué)位論文保密規(guī)定處理,-保密論文在解密后遵守此規(guī)定。論文作者簽名:訴慚導(dǎo)師簽名:日期:仞污年6,El2Et天津師范大學(xué)碩士研究生論文摘要隨著互聯(lián)網(wǎng)的發(fā)展和大數(shù)據(jù)時代的到來,個性化推薦服務(wù)已經(jīng)成為一種新的趨勢。協(xié)同過濾算法是目前推薦系統(tǒng)中應(yīng)用最成功和使用最廣泛的技術(shù)之一,它根據(jù)近鄰用戶的興趣偏好為目標(biāo)用戶產(chǎn)生推薦。這種算法在快速發(fā)展的同時也面臨著數(shù)據(jù)稀疏性、冷啟動問題等挑戰(zhàn)。本文提出了一種基于用戶評分和用戶特征的混合協(xié)同過濾算法,該算法綜合考慮用戶特征和用戶評分計(jì)算用戶之間的相似性。同
5、時,本文又將用戶特征劃分為用戶人口統(tǒng)計(jì)學(xué)特征和用戶話題特征,并建立了用戶人口統(tǒng)計(jì)學(xué)特征與話題特征的對照庫。若目標(biāo)用戶為老用戶,通過加權(quán)的方法綜合考慮用戶人口統(tǒng)計(jì)學(xué)特征、用戶話題特征和用戶評分來進(jìn)行用戶之間相似度的計(jì)算。若用戶為新用戶,通過用戶人口統(tǒng)計(jì)學(xué)特征和話題特征對照庫,確定該用戶的話題特征,并根據(jù)Jaccard系數(shù)進(jìn)行相似度的計(jì)算。最終,系統(tǒng)為目標(biāo)用戶產(chǎn)生推薦。本文采用MovieLens數(shù)據(jù)集作為算法實(shí)驗(yàn)的數(shù)據(jù),通過對比傳統(tǒng)協(xié)同過濾算法與本文提出的算法平均絕對誤差來進(jìn)行算法準(zhǔn)確度的檢驗(yàn)。實(shí)驗(yàn)結(jié)果表明本文提
6、出的算法在一定程度上提高了協(xié)同過濾算法的精確度,并改善了算法的冷啟動問題,從而提高了推薦的質(zhì)量和系統(tǒng)的性能。關(guān)鍵字:用戶評分,協(xié)同過濾,用戶人口統(tǒng)計(jì)學(xué)特征,用戶話題特征天津師范大學(xué)碩士研究生論文ABSTRACTWiththedevelopmentofinteractandthecomingoftheageofbigdata,personalizedrecommendationserviceshasbecomeanewtrend.Collaborativefilteringisoneofthemostwidel
7、yusedandsuccessfulmethodsforrecommendation,whichgeneratingrecommendationsforthetargetuserbythepreferenceinformationofhisneighborhoods.Withthefastdevelopmentofcollaborativefiltering,ithasmanychallenges,suchasdatasparsity,cold-startandSOon.AhybridCollaborativ
8、eFilteringAlgorithmbasedonusers’rmingandusers’featuresisproposed.Thisalgorithmconsidersusers’characteristicsandusers’ratingstocalculatethesimilaritybetweenusers.Simultaneouslyusers’featuresaredividedintousers’demographiccharacteristicsandusers’preferences.A
9、ndthedatabaseofdemographiccharacteristicsandpreferenceisestablished.Ifthetargetuserisanolduser,withthemethodofweight,thisalgorithmconsideringusers’demographiccharacteristics,users’preferenceandusers’rm