資源描述:
《一種基于云模型數(shù)據(jù)填充的算法》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、第2()卷第1期計算機技術與發(fā)展Vo1.20No.122()l0年.l2月)~_1PUTERI'ECHN(ⅥYANDDEVEI門PMENTDec.2010一種基于云模型數(shù)據(jù)填充的算法余志虎,戚玉峰(南京郵電大學計算機學院,江蘇南京210003)摘要:協(xié)同過濾推薦技術是現(xiàn)如今電子商務系統(tǒng)中最重要的技術之一。針對目前協(xié)同過濾推薦技術中存在的因數(shù)據(jù)極度稀疏而導致相似性度量不準,推薦質量嚴重受到影響的問題,利用云模型在定性知識表示及定性、定量知識轉換時的作用,提出一種基于云模型的數(shù)據(jù)填充算法,它利用相似用戶計算目標用戶評分缺失項。利用經典實驗數(shù)據(jù)進行驗證比較,結果表明,即使在用
2、戶評分數(shù)據(jù)極端稀疏的情況下,利用此算法對數(shù)據(jù)進行填充之后,再采用傳統(tǒng)的協(xié)同過濾推薦算法能取得較理想的推薦質量,從一定程度上解決了推薦系統(tǒng)中普遍存在的稀疏性問題。關鍵詞:云模型;數(shù)據(jù)稀疏;數(shù)據(jù)填充中圖分類號:TP301.6文獻標識碼:A文章編號:1673—629X(201O)12—0034—04ADataFillingAlgorithmBasedonCloudModelYUZhi—hu,QIYu—feng(Sch~lofComputer,NanjingUniversityofPosts&Telecommunications,Nanjing210003,China)Abst
3、ract:ThecollaborativefilteringisoneofthemostimportanttechnologiesincurrentE—corunlereesystem,intheviewofdataincol—laborativefilteringtechnologyareextremelysparseresultinginbadsimilarityme~tsureandrecommendpoorquality,usingacloudnxxtel’actioninqualitativeknowledgerepresentationandtheroleo
4、fconversionamongqualitativeandquantita~eknowledge,pr0p0sedadataf;lI—ingalgorithmbasedoncloudmodel,andusingtheclassicalexperim∞taldatatovalidateandcompare,itcalculateuserscoremissingiteco.sbyusingsimilaruser.Theresultshows,eveniftheuser’sratingdataisextremelysp~-se,itcangetbetterrecommend
5、ationqualitybyfilingdatawiththealgorithmandadoptingtraditionalcollaborativefilteringalgorithm.tosomeextentitcsnsolveo)lm啪spathepmb—lemsinrecorfl~endedsystem.Keywords:cloudmodel;datasparse;datafillingO引言或產品的特征來推薦給目標用戶或產品的打分數(shù)據(jù)現(xiàn)今世界信息量隨著網(wǎng)絡的發(fā)展而飛速膨脹,如值,其中最常使用的方法是K近鄰(K—NearestNeigh—從電子商務網(wǎng)站獲得的產品
6、數(shù)據(jù),其數(shù)據(jù)量增長的如bor,KNN)方法。從這種基于記憶的方法可以看出,算此快以致我們很難處理它,例如:Yahoo、Amazon和法比較簡單性,但其推薦效率高,也因此在推薦算法中CDNow等等這些網(wǎng)站每天都提供了大量選擇給它的是一種較成功的推薦方法。基于模型的方法則是采用潛在客戶如何從中找到最適合用戶的需求和愛好的一種預測模型3,這種模型是通過早先從產品評價庫產品則成為難點,為了克服這個問題,推薦系統(tǒng)出現(xiàn)并中獲得的一個模型,再把這種模型用于對應目標用戶變成了研究者的一個研究熱點。的推薦中去,目前比較流行的方法包括聚類模型[41、推薦系統(tǒng)中有一個最著名的方法就是協(xié)同過S
7、VD[5J等。上面幾種常用的推薦方法中,都有一個推濾?1,它分為基于記憶和模型兩種協(xié)同過濾算法,本質薦系統(tǒng)中常見的問題,那就是對冷啟動問題沒有很好是通過對已有數(shù)據(jù)通過與其相似性來推薦目標數(shù)據(jù)評的得到解決,從而會使推薦精確度受很大影響,表現(xiàn)分值,其中,基于記憶協(xié)同過濾算法包括基于產品協(xié)同為,當一個用戶評分數(shù)據(jù)稀疏時,這很容易找到,如當過濾2和基于用戶協(xié)同過濾,其思想是通過相似用戶當網(wǎng)中圖書數(shù)據(jù)庫,一個龐大的產品庫,一些冷門書會很難得到用戶的評分以及一些新手購書很少有評價值,從而很難從中找到相似的用戶,這就導致最后推薦收稿日期:2010—04