基于時間加權(quán)的混合推薦算法研究

基于時間加權(quán)的混合推薦算法研究

ID:36352990

大小:3.38 MB

頁數(shù):58頁

時間:2019-05-09

基于時間加權(quán)的混合推薦算法研究_第1頁
基于時間加權(quán)的混合推薦算法研究_第2頁
基于時間加權(quán)的混合推薦算法研究_第3頁
基于時間加權(quán)的混合推薦算法研究_第4頁
基于時間加權(quán)的混合推薦算法研究_第5頁
資源描述:

《基于時間加權(quán)的混合推薦算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、廈門大學(xué)學(xué)位論文原創(chuàng)性聲明本人呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下,獨(dú)立完成的研究成果。本人在論文寫作中參考其他個人或集體己經(jīng)發(fā)表的研究成果,均在文中以適當(dāng)方式明確標(biāo)明,并符合法律規(guī)范和《廈門大學(xué)研究生學(xué)術(shù)活動規(guī)范(試行)》。另外,該學(xué)位論文為()課題(組)的研究成果,獲得()課題(組)經(jīng)費(fèi)或?qū)嶒?yàn)室的資助,在()實(shí)驗(yàn)室完成。(請在以上括號內(nèi)填寫課題或課題組負(fù)責(zé)人或?qū)嶒?yàn)室名稱,未有此項(xiàng)聲明內(nèi)容的,可以不作特別聲明。)聲明人(簽名):卻剃Ⅺ哆年6月弓日廈門大學(xué)學(xué)位論文著作權(quán)使用聲明本人同意廈門大學(xué)根據(jù)《中華人民共和國學(xué)位條例暫行實(shí)施辦法》等規(guī)定保留和使用

2、此學(xué)位論文,并向主管部門或其指定機(jī)構(gòu)送交學(xué)位論文(包括紙質(zhì)版和電子版),允許學(xué)位論文進(jìn)入廈門大學(xué)圖書館及其數(shù)據(jù)庫被查閱、借閱。本人同意廈門大學(xué)將學(xué)位論文加入全國博士、碩士學(xué)位論文共建單位數(shù)據(jù)庫進(jìn)行檢索,將學(xué)位論文的標(biāo)題和摘要匯編出版,采用影印、縮印或者其它方式合理復(fù)制學(xué)位論文。本學(xué)位論文屬于:()1.經(jīng)廈門大學(xué)保密委員會審查核定的保密學(xué)位論文,于年月日解密,解密后適用上述授權(quán)。()2.不保密,適用上述授權(quán)。(請在以上相應(yīng)括號內(nèi)打“√”或填上相應(yīng)內(nèi)容。保密學(xué)位論文應(yīng)是已經(jīng)廈門大學(xué)保密委員會審定過的學(xué)位論文,未經(jīng)廈門大學(xué)保密委員會審定的學(xué)位論文均為公

3、開學(xué)位論文。此聲明欄不填寫的,默認(rèn)為公開學(xué)位論文,均適用上述授權(quán)。)聲明人j㈣:狳戳廠I7-.ol3年勿月摘要隨著互聯(lián)網(wǎng)的迅猛發(fā)展,發(fā)布在互聯(lián)網(wǎng)上的商務(wù)信息呈爆炸性增長。但據(jù)統(tǒng)計,相對于99%的用戶而言,99%的Web信息是無用的,大量的無關(guān)信息會干擾甚至淹沒用戶真正需要的內(nèi)容。因此,推薦系統(tǒng)應(yīng)運(yùn)而生,它利用網(wǎng)站向用戶提供商品信息和建議,幫助網(wǎng)站有效地留住用戶,防止用戶流失。但是隨著推薦系統(tǒng)規(guī)模的進(jìn)一步擴(kuò)大,推薦系統(tǒng)也面臨一系列挑戰(zhàn)。包括實(shí)時性和可擴(kuò)展性、稀疏性和“冷啟動"等方面的問題。這些問題影響了推薦系統(tǒng)的效率和推薦質(zhì)量。因此,對推薦系統(tǒng)所面

4、臨的問題的研究具有十分重要的意義。本文對推薦系統(tǒng)的數(shù)據(jù)稀疏性問題、推薦精度問題和推薦質(zhì)量問題進(jìn)行了深入的研究。本文首先詳細(xì)地分析了協(xié)同過濾算法中的數(shù)據(jù)稀疏性問題,研究了現(xiàn)有的解決方法,針對傳統(tǒng)的相似度度量方法會導(dǎo)致預(yù)測誤差的問題,提出了一種新的基于SimHash相似度計算方法。算法通過提取項(xiàng)目的特征向量,利用SimHash算法的高效降維,快速計算項(xiàng)目的近鄰。然后根據(jù)用戶對項(xiàng)目近鄰的評分結(jié)合項(xiàng)目的平均評分得到最后評分填充用戶一項(xiàng)目評分矩陣中的空白項(xiàng)。實(shí)驗(yàn)證明該方法有效的解決了評分矩陣的稀疏性問題,提高了推薦算法的推薦質(zhì)量同時還大大減少了算法的時間復(fù)

5、雜度,提高了推薦算法的實(shí)時響應(yīng)速度。深入研究了傳統(tǒng)的推薦算法,指出了傳統(tǒng)的推薦算法忽略了用戶的興趣會隨時間而變化這一特點(diǎn),根據(jù)傳統(tǒng)推薦算法的不足之處提出了一種基于時間加權(quán)的混合推薦算法,該算法在使用基于SimHash的相似度計算方法解決評分矩陣稀疏性問題的基礎(chǔ)上,利用用戶對項(xiàng)目的評分相似度和評分時間相似度來計算用戶間的相似度。最后在預(yù)測用戶對未評分項(xiàng)的分?jǐn)?shù)時,通過時間衰減因子對分?jǐn)?shù)進(jìn)行時間加權(quán),實(shí)現(xiàn)了用戶興趣的時間效應(yīng)。實(shí)驗(yàn)結(jié)果表明該算法解決了因用戶的興趣隨時間衰減轉(zhuǎn)變而導(dǎo)致的推薦質(zhì)量低的問題,豐富了推薦系統(tǒng)的個性化特點(diǎn)。關(guān)鍵字:推薦系統(tǒng)、協(xié)同過

6、濾、時間AbstractWiththerapiddevelopmentoftheInternet,businessinformationpublishedontheInternetgowsexplosively.Butaccordingtostatistics,for99%users,99%webinformationisuseless.Alargenumberofirrelevantinformationwilldisruptevendrownwhatusersreallyneed.Therefore,therecommendersysteme

7、merged.Ituseswebsitetooffercommodityinformationandadviceforusers,helpsthewebsitetoke印theUSers,andpmventsthebstofusers.Withthefurtherexpansionoftherecommendersystem,therecommendersystemisfacingaseriesofchallenges,includingreal-timeissues,expandability,sparsity,‘'coldstart’’and

8、SOoILTheseissuesimpacttheefficiencyandrecommendationqmlityoftherecom

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。