資源描述:
《基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)研究1.數(shù)據(jù)挖掘技術(shù)1.1數(shù)據(jù)挖掘概述所謂數(shù)據(jù)挖掘就是指在眾多數(shù)據(jù)中抽取有用資料的過程,這些有用的資料是在海量數(shù)據(jù)中經(jīng)過篩選、過濾、清洗、提取出來的,能體現(xiàn)客戶潛在需求。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析相比,數(shù)據(jù)挖掘具有預知性、有效性和實用性等特點。傳統(tǒng)的數(shù)據(jù)分析則是定向分析、費用高、不能及時有效的提供相關(guān)數(shù)據(jù),具有一定的局限性。而數(shù)據(jù)挖掘通過利用多種分析工具,來對大量的數(shù)據(jù)進行抽取分析,發(fā)現(xiàn)數(shù)據(jù)中蘊含的關(guān)系或規(guī)則,對商業(yè)決策具有重要支持性作用。1.2數(shù)據(jù)挖掘的功能數(shù)據(jù)挖掘往往有兩類任務(wù):一是描述,二是預測。對于描述性任務(wù)幾乎都是利用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)刻畫其普
2、遍特性,而預測性任務(wù)則是根據(jù)現(xiàn)有的數(shù)據(jù)進行分析預測。當前,數(shù)據(jù)挖掘功能有以下幾類:1.2.1利用概念描述發(fā)現(xiàn)廣義知識通過對某類對象進行細致描述,從而對該數(shù)據(jù)進行概括、提煉。而概念描述又分為兩類,一種是描述同類對象的共性,即為特征性描述。另一種是描述異類對象的異性,即為區(qū)別性描述。1.2.2利用關(guān)聯(lián)分析發(fā)現(xiàn)關(guān)聯(lián)知識利用不同變量的取值,發(fā)現(xiàn)他們存在某種關(guān)系,而這往往是屬于被發(fā)現(xiàn)的重要資料。這種關(guān)聯(lián)往往分成三類,即簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián),等等。1.2.3利用分類和聚類方法發(fā)現(xiàn)分類知識將數(shù)據(jù)對象分類或者將數(shù)據(jù)對象分成多個簇,來發(fā)現(xiàn)其同類對象的共性和異類對象的異性相關(guān)知識。1.2.4利用預
3、測方法獲取預測型知識利用過去或者當前的與時間有關(guān)的數(shù)據(jù)對未來的相關(guān)數(shù)據(jù)進行推測。1.2.5采用偏差檢測來獲取偏差型知識利用數(shù)據(jù)庫中的異常數(shù)據(jù)進行分析,解釋出現(xiàn)異?,F(xiàn)象的原因。1.3數(shù)據(jù)挖掘過程從查找數(shù)據(jù)開始,通過一定的算法或模型發(fā)現(xiàn)數(shù)據(jù)間的關(guān)聯(lián)性,并提取出新的知識或規(guī)律,從而得出新的結(jié)論。這一流程包括以下幾個步驟:首先,提出陳述的問題和要闡明的假設(shè),從中發(fā)現(xiàn)問題,提出假設(shè),利用相關(guān)數(shù)據(jù)去發(fā)現(xiàn),去解釋其原因,從中得到完善。其次是收集數(shù)據(jù)。有關(guān)數(shù)據(jù)的收集分為兩類:一類是可控數(shù)據(jù),另一類是不可控數(shù)據(jù)。采用不同的收集方法收集出來的結(jié)果也是不同的。因此,在收集過程中要知道數(shù)據(jù)收集是如何對其理論分
4、布產(chǎn)生影響的,這樣才能在應(yīng)用中順利進行。再次是數(shù)據(jù)的預處理。通過完成異常點的檢測和比例縮放、編碼和選擇特征等常見任務(wù),來對數(shù)據(jù)挖掘過程中諸多預處理活動進行說明性例證。之后是對模型進行評估。先建立一些新模型,并進行評估選出最佳模型,數(shù)據(jù)挖掘技術(shù)利用該模型對數(shù)據(jù)進行分析。最后解釋模型得出結(jié)論。通過對模型的解釋使數(shù)據(jù)挖掘所得出來的結(jié)果更加容易理解,簡單明了,為決策者提供決策支持。2.數(shù)據(jù)挖掘與電子商務(wù)2.1電子商務(wù)發(fā)展中存在的問題大量X絡(luò)商品的涌現(xiàn),不論是買方或是賣方都會面臨著諸多問題。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)為電子商務(wù)活動提供了強大的數(shù)據(jù)分析和技術(shù)支持。數(shù)據(jù)挖掘是面向應(yīng)用的,電子商務(wù)的發(fā)展使得越
5、來越多的企業(yè)開始X上交易,電子商務(wù)后臺數(shù)據(jù)庫中客戶相關(guān)的數(shù)據(jù)和大量的交易記錄以及跟蹤用戶在len介紹,亞馬遜至少有35%的銷售額來自于推薦系統(tǒng)。2.3數(shù)據(jù)挖掘?qū)﹄娮由虅?wù)的影響通過電子商務(wù)與數(shù)據(jù)挖掘技術(shù)進行優(yōu)化配置,建立合理的電子商務(wù)推薦系統(tǒng),采用有效的組合推薦,將所有的推薦模型進3.2電子商務(wù)推薦系統(tǒng)設(shè)計按照系統(tǒng)論的觀點,可將電子商務(wù)推薦系統(tǒng)分成四個組成部分:信息輸人、信息處理、模式發(fā)現(xiàn)與用戶反饋。首先,信息輸人主要于數(shù)據(jù)倉庫。其次,信息處理是基于各種不同的算法模型對數(shù)據(jù)倉庫里的數(shù)據(jù)進行分析和處理,挖掘出潛在的規(guī)律或模式,即模式發(fā)現(xiàn)。最后,用戶客觀公正的反饋是評價推薦系統(tǒng)準確性與可信性
6、的主要依據(jù)。基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)設(shè)計邏輯模型如圖丨所示。4.結(jié)語隨著X絡(luò)科技的步伐不斷加快,人們對電子商務(wù)的需求也不斷加大,收集大量的用戶數(shù)據(jù)進行科學分析,挖掘客戶潛在需求,進行個性化的推薦。基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)搭建起客戶與商家的橋梁,其必然推動電子商務(wù)的進一步發(fā)展。郭鵬(海南經(jīng)貿(mào)職業(yè)技術(shù)學院,???71127)