資源描述:
《一種基于領(lǐng)域本體的混合推薦算法-論文.pdf》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、兩化融合一種基于領(lǐng)域本體的混合推薦算法鄭元平/浙江師范大學(xué)數(shù)理與信息工程學(xué)院.r.容過濾主要取決于表征項目的內(nèi)容(或特content(d1)=(wli,w2l,W3i,?)(3)I'’I征)之間的相似度,其優(yōu)點(diǎn)是它不需要額外而用戶的興趣則通過算法從Content中學(xué)習(xí)得到。令的其他用戶的數(shù)據(jù),它只需要用戶的使用歷profile(u)表示用戶的興趣模型,一種簡單的表征用戶興史記錄以及相關(guān)項目的信息。然而,這種推薦算法的缺點(diǎn)趣模型的方式為:卻是:隨著系統(tǒng)當(dāng)中項目數(shù)量的增多,計算項目(或特lprq/~/e()。Ⅳ“1l,czmtent(∥)(4)征)間的相似度將變成棘手的問題。協(xié)同
2、過濾算法是基于用戶之間相似性的,它不需要項目的其他信息。然而,協(xié)任意給定一個用戶u,11一個待推薦的項目d,則用戶U同過濾卻面臨冷啟動問題?,此外矩陣稀疏性問題也是傳對d的喜好程度可以表示為:統(tǒng)協(xié)同過濾推薦算法的另一個嚴(yán)重的問題。同時,傳統(tǒng)CBPref(u,d)=Score(profile(u),content(d))(5)的這兩種推薦算法不能很好的挖掘和預(yù)測用戶的興趣,并2領(lǐng)域本體且它們對于用戶興趣的變化做出的反應(yīng)非常慢。本體(Ontology)是關(guān)于一個領(lǐng)域的明確的規(guī)范的形1主要的推薦算法式化說明。圖1展示的是電影推薦領(lǐng)域中相關(guān)的抽象概1.1協(xié)同過濾(簡稱CF)。是目前使
3、用和研究最多的念。推薦算法”,協(xié)同過濾通過鄰居用戶的信息來計算得到目標(biāo)用戶的推薦。其認(rèn)為:一個用戶會與和他有相同興趣的用戶喜歡相同的項目。任意給定兩個用戶U和v,用N(u)表示用戶U的特征集合,N(v)表示用戶v的特征集合,則u和v的相似度可以使用如下公式進(jìn)行描述:N()nnr)Ⅲ“)。;Ui一.)~JN÷、(1)于是,用戶u對項日i的喜好程度可由預(yù)測評分表示為:(、-,:,te~u,,)=IZ~'erSim(u,).wte(v,)(2)、協(xié)同過濾以用戶對項目的評分來代表用戶的喜好程度,協(xié)同過濾算法使用用戶.項目評分矩陣的行列向量來表示用戶和項目,因而用戶和項目都是用評分向量
4、表示的。圖1領(lǐng)域本體MovieLens、Ringo和Tapestry等是使用協(xié)同過濾著名的系其中與用戶相關(guān)的信息有兩方面:使用歷史是用來記統(tǒng)錄用戶在觀看電影時的動作的?!d趣節(jié)點(diǎn)記錄的是用戶的1.2內(nèi)容過濾(簡稱CB)從搜索引擎發(fā)展而來】,是興趣,其中對象屬性“興趣點(diǎn)”指向的是用戶感興趣的對協(xié)同過濾技術(shù)的延續(xù),是一種非常重要的推薦技術(shù),也是象,它的實(shí)例即為用戶的Profile。其中的用戶興趣部分是一種匹配技術(shù)。CB認(rèn)為用戶會喜歡與他之前喜歡的項目相最主要的,在本文用戶的興趣模型被描述為向量Profile=似的項目。內(nèi)容過濾要求為項目和用戶建模,一般的方法(Il,I2,??,I
5、N)。是設(shè)立配置文件(profile)用于儲存用戶興趣和項目的內(nèi)3基于本體的推薦算法容【9】。令k,是項目d的第i個關(guān)鍵詞,W。為ki對應(yīng)的權(quán)重,那3.1本體中概念的語義相似度計算公式么項目di可以用向量模型表示為:在本文中,我們引進(jìn)語義相似度計算公式,則本體中●卜—————————一中圖分類號:TP391.3CDSoftwareandApplicationsl134本期關(guān)注兩化融合任意兩個概念A(yù)和B的語義相似度定義為:基于本體的混合推薦。以上算法的步驟只進(jìn)行到評分預(yù)測,并未得出最終的推薦結(jié)果。在混合推薦算法中,本?l/。j'L—detain'(.4一,B)j(6)文將上面多
6、種算法的預(yù)測評分進(jìn)行線性組合,得到組合評其中:distance()表示樹形結(jié)構(gòu)中兩個節(jié)點(diǎn)的距分,其步驟為:離,depth()、density()分別表示節(jié)點(diǎn)深度和密度。公1C:使用(10)組合評分公式進(jìn)行評分:式中的三個因式分別代表語義距離、節(jié)點(diǎn)深度和密度對語HYbPref(u,d)=Q·CBPref(u,d)+義相似度的影響。(1.Q)·CFPref(u,d)(10)3.2基于本體的推薦算法接下來的步驟是以上算法都可以繼續(xù)的步驟,它是以基于本體的協(xié)同過濾。其算法步驟為:上算法的推薦步驟。1A:使用公式計算出與目標(biāo)用戶最相似的K個鄰居;對剛剛評分的項目按評分排序,將評分最高的
7、前N個UserSim(u,v)=Osim(u,V)=Osim(profile項目推薦給用戶。(u),profile(v))(7)因此,在實(shí)際系統(tǒng)當(dāng)中我們的算法即可以各自單獨(dú)的2A:使用公式(8)進(jìn)行評分預(yù)測,并用預(yù)測評分填運(yùn)行,也可以兩種組合起來運(yùn)行。充和修正評分矩陣;4結(jié)束語cF1,:?ff_卜w(CpdataTim~J.L(seJ'Sim(tt·l)rate(v,d)(8)在基于本體的協(xié)同過濾和內(nèi)容過濾算法中,本文將基于本體的內(nèi)容過濾。其算法步驟為:傳統(tǒng)的基于向量模型的相似度計算公式改為了基于本體1