資源描述:
《基于時間加權(quán)的混合推薦算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、廈門大學(xué)學(xué)位論文原創(chuàng)性聲明本人呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下,獨(dú)立完成的研究成果。本人在論文寫作中參考其他個人或集體己經(jīng)發(fā)表的研究成果,均在文中以適當(dāng)方式明確標(biāo)明,并符合法律規(guī)范和《廈門大學(xué)研究生學(xué)術(shù)活動規(guī)范(試行)》。另外,該學(xué)位論文為()課題(組)的研究成果,獲得()課題(組)經(jīng)費(fèi)或?qū)嶒?yàn)室的資助,在()實(shí)驗(yàn)室完成。(請在以上括號內(nèi)填寫課題或課題組負(fù)責(zé)人或?qū)嶒?yàn)室名稱,未有此項(xiàng)聲明內(nèi)容的,可以不作特別聲明。)聲明人(簽名):卻剃Ⅺ哆年6月弓日廈門大學(xué)學(xué)位論文著作權(quán)使用聲明本人同意廈門大學(xué)根據(jù)《中華人民共和國學(xué)位條例暫行實(shí)施辦法》等規(guī)定保留和使用
2、此學(xué)位論文,并向主管部門或其指定機(jī)構(gòu)送交學(xué)位論文(包括紙質(zhì)版和電子版),允許學(xué)位論文進(jìn)入廈門大學(xué)圖書館及其數(shù)據(jù)庫被查閱、借閱。本人同意廈門大學(xué)將學(xué)位論文加入全國博士、碩士學(xué)位論文共建單位數(shù)據(jù)庫進(jìn)行檢索,將學(xué)位論文的標(biāo)題和摘要匯編出版,采用影印、縮印或者其它方式合理復(fù)制學(xué)位論文。本學(xué)位論文屬于:()1.經(jīng)廈門大學(xué)保密委員會審查核定的保密學(xué)位論文,于年月日解密,解密后適用上述授權(quán)。()2.不保密,適用上述授權(quán)。(請在以上相應(yīng)括號內(nèi)打“√”或填上相應(yīng)內(nèi)容。保密學(xué)位論文應(yīng)是已經(jīng)廈門大學(xué)保密委員會審定過的學(xué)位論文,未經(jīng)廈門大學(xué)保密委員會審定的學(xué)位論文均為公
3、開學(xué)位論文。此聲明欄不填寫的,默認(rèn)為公開學(xué)位論文,均適用上述授權(quán)。)聲明人j㈣:狳戳廠I7-.ol3年勿月摘要隨著互聯(lián)網(wǎng)的迅猛發(fā)展,發(fā)布在互聯(lián)網(wǎng)上的商務(wù)信息呈爆炸性增長。但據(jù)統(tǒng)計,相對于99%的用戶而言,99%的Web信息是無用的,大量的無關(guān)信息會干擾甚至淹沒用戶真正需要的內(nèi)容。因此,推薦系統(tǒng)應(yīng)運(yùn)而生,它利用網(wǎng)站向用戶提供商品信息和建議,幫助網(wǎng)站有效地留住用戶,防止用戶流失。但是隨著推薦系統(tǒng)規(guī)模的進(jìn)一步擴(kuò)大,推薦系統(tǒng)也面臨一系列挑戰(zhàn)。包括實(shí)時性和可擴(kuò)展性、稀疏性和“冷啟動"等方面的問題。這些問題影響了推薦系統(tǒng)的效率和推薦質(zhì)量。因此,對推薦系統(tǒng)所面
4、臨的問題的研究具有十分重要的意義。本文對推薦系統(tǒng)的數(shù)據(jù)稀疏性問題、推薦精度問題和推薦質(zhì)量問題進(jìn)行了深入的研究。本文首先詳細(xì)地分析了協(xié)同過濾算法中的數(shù)據(jù)稀疏性問題,研究了現(xiàn)有的解決方法,針對傳統(tǒng)的相似度度量方法會導(dǎo)致預(yù)測誤差的問題,提出了一種新的基于SimHash相似度計算方法。算法通過提取項(xiàng)目的特征向量,利用SimHash算法的高效降維,快速計算項(xiàng)目的近鄰。然后根據(jù)用戶對項(xiàng)目近鄰的評分結(jié)合項(xiàng)目的平均評分得到最后評分填充用戶一項(xiàng)目評分矩陣中的空白項(xiàng)。實(shí)驗(yàn)證明該方法有效的解決了評分矩陣的稀疏性問題,提高了推薦算法的推薦質(zhì)量同時還大大減少了算法的時間復(fù)
5、雜度,提高了推薦算法的實(shí)時響應(yīng)速度。深入研究了傳統(tǒng)的推薦算法,指出了傳統(tǒng)的推薦算法忽略了用戶的興趣會隨時間而變化這一特點(diǎn),根據(jù)傳統(tǒng)推薦算法的不足之處提出了一種基于時間加權(quán)的混合推薦算法,該算法在使用基于SimHash的相似度計算方法解決評分矩陣稀疏性問題的基礎(chǔ)上,利用用戶對項(xiàng)目的評分相似度和評分時間相似度來計算用戶間的相似度。最后在預(yù)測用戶對未評分項(xiàng)的分?jǐn)?shù)時,通過時間衰減因子對分?jǐn)?shù)進(jìn)行時間加權(quán),實(shí)現(xiàn)了用戶興趣的時間效應(yīng)。實(shí)驗(yàn)結(jié)果表明該算法解決了因用戶的興趣隨時間衰減轉(zhuǎn)變而導(dǎo)致的推薦質(zhì)量低的問題,豐富了推薦系統(tǒng)的個性化特點(diǎn)。關(guān)鍵字:推薦系統(tǒng)、協(xié)同過
6、濾、時間AbstractWiththerapiddevelopmentoftheInternet,businessinformationpublishedontheInternetgowsexplosively.Butaccordingtostatistics,for99%users,99%webinformationisuseless.Alargenumberofirrelevantinformationwilldisruptevendrownwhatusersreallyneed.Therefore,therecommendersysteme
7、merged.Ituseswebsitetooffercommodityinformationandadviceforusers,helpsthewebsitetoke印theUSers,andpmventsthebstofusers.Withthefurtherexpansionoftherecommendersystem,therecommendersystemisfacingaseriesofchallenges,includingreal-timeissues,expandability,sparsity,‘'coldstart’’and
8、SOoILTheseissuesimpacttheefficiencyandrecommendationqmlityoftherecom