資源描述:
《基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng) 摘要:近年來,電子商務(wù)推薦系統(tǒng)趨于成熟,并得到了廣泛的應(yīng)用。電子商務(wù)旅游線路推薦系統(tǒng),能夠在信息數(shù)據(jù)分析的基礎(chǔ)上,實現(xiàn)個性化的旅游線路設(shè)計。在具體的推薦系統(tǒng)設(shè)計中需要處理好實時性與精度這對矛盾,基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng),運用關(guān)聯(lián)規(guī)則算法,獲得各個景點之間的關(guān)聯(lián)關(guān)系,能夠?qū)崿F(xiàn)較為理想的旅游線路推薦效果。 關(guān)鍵詞:數(shù)據(jù)挖掘;電子商務(wù)推薦系統(tǒng);旅游線路;關(guān)聯(lián)規(guī)則 中圖分類號:TP311.13文獻(xiàn)標(biāo)識碼:ADOI:10.3969/j.issn.1003
2、-6970.2013.03.017 0引言 隨著生活水平的不斷提高,旅游已經(jīng)逐漸成為人們生活中的重要組成部分,旅游市場也日益火爆。面對眾多的旅游景點,怎樣進(jìn)行選擇,不斷困擾著計劃出行的游者。目前,一些旅游企業(yè)在規(guī)劃旅游線路時,主要是采用主題旅游線路設(shè)計、超市型旅游線路設(shè)計、運籌學(xué)方法旅游線路設(shè)計以及市場導(dǎo)向的旅游線路設(shè)計。這些旅游線路設(shè)計,并沒有充分利用現(xiàn)代信息技術(shù)的優(yōu)勢,在具體實施中會暴露出一些問題。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)挖掘等技術(shù)在電子商務(wù)推薦系統(tǒng)中的應(yīng)用日益廣泛,這為旅游線路設(shè)計開辟了一條新的途
3、徑。6 1基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng)的整體構(gòu)架 在電子商務(wù)旅游線路推薦系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù),能夠有效地滿足人們的個性化需求。在具體應(yīng)用中主要涉及三種關(guān)鍵性的技術(shù):數(shù)據(jù)挖掘算法應(yīng)用技術(shù)、原始數(shù)據(jù)處理技術(shù)、模式庫建立與表示技術(shù)。在電子商務(wù)旅游線路推薦系統(tǒng)中,推薦的實時性與精度是一對矛盾。目前的一些推薦技術(shù)為了確保實時性,往往會犧牲推薦的精度。鑒于此,本研究設(shè)計了一個基于數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)規(guī)則的電子商務(wù)旅游線路推薦系統(tǒng)。此系統(tǒng)的設(shè)計基于B/S結(jié)構(gòu),其具體結(jié)構(gòu)圖見圖1?! 』跀?shù)據(jù)挖掘技術(shù)的電子商
4、務(wù)旅游線路推薦系統(tǒng)的整體結(jié)構(gòu)由兩部分組成:離線部分與在線部分。離線部分主要是由WEB挖掘與數(shù)據(jù)預(yù)處理組成,是模型獲取階段,具體包括總體使用特征獲取與數(shù)據(jù)預(yù)處理。總體使用特征指的是數(shù)據(jù)挖掘算法產(chǎn)生的規(guī)則或知識,并以某種形式在媒質(zhì)中存儲,能夠為在線部分提供必要的支撐,因此離線部分是在線部分的支撐部分。系統(tǒng)中的在線部分是動態(tài)的實時過程,是推薦引擎的實現(xiàn)。離線部分與在線部分有著基本一致的處理過程,兩個部分相互作用,推薦系統(tǒng)能夠確保給用戶呈現(xiàn)的推薦具有合理性與實時性。因為離線部分與在線部分實現(xiàn)了分離,所以可以極大的增加了
5、數(shù)據(jù)量,提高了電子商務(wù)旅游線路推薦的實時響應(yīng)速度和推薦服務(wù)的伸縮能力。 2基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng)的模塊分析 2.1離線模塊6 基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng)的離線模塊,能夠為推薦引擎工作提供支持,包括數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)預(yù)處理和模式分解,此模塊的系統(tǒng)結(jié)構(gòu)如圖2所示?! ≡陔娮由虅?wù)旅游線路推薦系統(tǒng)中,每個環(huán)節(jié)均要從相應(yīng)數(shù)據(jù)庫中檢索所需的數(shù)據(jù),例如模式數(shù)據(jù)庫、用戶登記數(shù)據(jù)庫以及景點信息數(shù)據(jù)庫等。離線模塊中的數(shù)據(jù)庫管理系統(tǒng)主要負(fù)責(zé)操作、維護(hù)與管理數(shù)據(jù)庫中的數(shù)據(jù)。實際上,數(shù)據(jù)庫管理
6、系統(tǒng)處于數(shù)據(jù)庫和在線推薦應(yīng)用的中間層,一般情況下可以直接采用市場上通用的數(shù)據(jù)庫管理系統(tǒng)軟件。在數(shù)據(jù)挖掘的過程中,數(shù)據(jù)預(yù)處理是不可或缺的階段,由于初始數(shù)據(jù)多半是含有噪聲的、不完整的,數(shù)據(jù)有著多種多樣的格式,在實際的系統(tǒng)應(yīng)用中就需要抽取有用的數(shù)據(jù),將初始數(shù)據(jù)轉(zhuǎn)化為推薦系統(tǒng)中數(shù)據(jù)挖掘算法可以識別的格式。因此,就需要進(jìn)行數(shù)據(jù)預(yù)處理,WEB進(jìn)行的數(shù)據(jù)預(yù)處理具體包括數(shù)據(jù)清洗、會話識別等,對結(jié)構(gòu)數(shù)據(jù)預(yù)內(nèi)容數(shù)據(jù)進(jìn)行必要的處理,為后續(xù)的數(shù)據(jù)挖掘提供有效的數(shù)據(jù)源?;跀?shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng)的關(guān)鍵環(huán)節(jié)是模式分解,模式
7、分解是通過數(shù)據(jù)挖掘技術(shù)生成推薦系統(tǒng)所需的模式。WEB服務(wù)器日志與相應(yīng)的數(shù)據(jù)庫是模式分解的基礎(chǔ),模式分析器通過分析WEB服務(wù)器日志數(shù)據(jù),獲取相關(guān)信息,分析相關(guān)數(shù)據(jù)庫,找到選擇景點時,景點之間存在的關(guān)聯(lián)相似模式。因為模式分析器需要耗費大量資源和時間,所以將此部分放入離線模塊中,讓系統(tǒng)定期地自動運行,更新模式數(shù)據(jù)庫?! ?.2在線模塊6 基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng)的在線模塊,能夠為用戶提供在線瀏覽推薦服務(wù),此部分設(shè)計的優(yōu)劣直接影響著整個旅游線路推薦系統(tǒng)的水平與推廣應(yīng)用效果。在線模塊的具體結(jié)構(gòu)如圖3所
8、示?! ‰娮由虅?wù)旅游線路推薦系統(tǒng)在線模塊的關(guān)聯(lián)規(guī)則挖掘模塊通過利用清理、轉(zhuǎn)換和加載工具,從數(shù)據(jù)庫中抽取數(shù)據(jù),并生產(chǎn)標(biāo)準(zhǔn)數(shù)據(jù),以進(jìn)行深入挖掘。關(guān)聯(lián)規(guī)則挖掘的實現(xiàn),需要應(yīng)用到Apriori算法,將挖掘的關(guān)聯(lián)規(guī)則寫入到規(guī)則庫當(dāng)中。電子商務(wù)旅游線路推薦系統(tǒng)在線模塊的推薦模塊能夠利用WEB為訪問系統(tǒng)的用戶直接提供服務(wù),其能夠記錄用戶訪問過的旅游站點,生成相關(guān)的數(shù)據(jù),體現(xiàn)了ARTRMS智能化的優(yōu)點