資源描述:
《數(shù)據(jù)挖掘技術(shù)在crm中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用 摘要:本文闡述了CRM的內(nèi)涵和外延及數(shù)據(jù)挖掘技術(shù)常用的算法和分析方法,并在此基礎(chǔ)上重點(diǎn)分析了數(shù)據(jù)挖掘技術(shù)在CRM中的功能和應(yīng)用?! £P(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘;知識(shí)發(fā)現(xiàn);客戶關(guān)系管理 一、CRM的概念 經(jīng)過20多年的發(fā)展,市場(chǎng)經(jīng)濟(jì)的觀念已深入人心,一些先進(jìn)企業(yè)的經(jīng)營(yíng)理念正在經(jīng)歷著從以產(chǎn)品為中心向以客戶為中心的轉(zhuǎn)移。在這種背景下,企業(yè)有必要對(duì)客戶的各種活動(dòng)和信息進(jìn)行集成,實(shí)現(xiàn)對(duì)客戶的全面管理,這就是所謂的“客戶關(guān)系管理”(CRM)?! 】蛻絷P(guān)系管理(CRM)源于以客戶為中心的商業(yè)模式,其通過對(duì)客戶關(guān)系的有效管理,以鑒別、獲得、保持為企業(yè)帶來(lái)利潤(rùn)的客戶
2、,是一種新型的管理機(jī)制。到目前為止,CRM還沒有統(tǒng)一的定義,最早提出CRM概念的GartnerGroup認(rèn)為,客戶關(guān)系管理是為企業(yè)提供全方位的管理視角,賦予企業(yè)更完善的客戶交流能力,從而實(shí)現(xiàn)客戶收益率的最大化。根據(jù)企業(yè)資源管理研究中心(AMT)的定義,CRM是一種以客戶為中心的經(jīng)營(yíng)策略,它以信息技術(shù)為手段對(duì)相關(guān)業(yè)務(wù)功能進(jìn)行重新設(shè)計(jì),并對(duì)相關(guān)工作流程進(jìn)行重組,以達(dá)到留住老客戶、吸引新客戶、提高客戶利潤(rùn)貢獻(xiàn)度的目的。筆者認(rèn)為,客戶關(guān)系管理(CRM)是現(xiàn)代企業(yè)管理的核心思想,它貫徹以客戶為中心的經(jīng)營(yíng)理念,利用信息技術(shù)來(lái)充分把握和了解客戶,在適當(dāng)?shù)臅r(shí)候,把適當(dāng)?shù)漠a(chǎn)品,通過適當(dāng)?shù)耐緩剑峁┙o
3、適當(dāng)?shù)目蛻?。CRM為企業(yè)提供了一個(gè)收集、分析和利用各種客戶信息的系統(tǒng),幫助企業(yè)充分利用其客戶管理資源,也為企業(yè)在電子商務(wù)時(shí)代從容應(yīng)對(duì)不同的客戶提供了科學(xué)的手段和方法?! 《?shù)據(jù)挖掘技術(shù) 1.?dāng)?shù)據(jù)挖掘常用的算法。 ?。?)決策樹(decisiontree)決策算法。決策樹是一個(gè)類似于流程圖的樹結(jié)構(gòu),其中每個(gè)內(nèi)部節(jié)點(diǎn)表示在一個(gè)屬性上的測(cè)試,每個(gè)分枝代表一個(gè)測(cè)試輸出,而每個(gè)樹葉節(jié)點(diǎn)代表類或類分布。決策樹算法包括樹的構(gòu)造和樹的剪枝,有兩種常用的剪枝方法:先剪枝和后剪枝?! 。?)神經(jīng)網(wǎng)絡(luò)(NeuralNets)。遺傳算法根據(jù)適者生存的原則,形成由當(dāng)前群體中最適合的規(guī)則組成新的群體,以及
4、這些規(guī)則的后代。遺傳算法用于分類和其他優(yōu)化問題?! 。?)粗糙集方法。粗糙集方法基于給定訓(xùn)練數(shù)據(jù)內(nèi)部的等價(jià)類的建立。它將知識(shí)理解為對(duì)數(shù)據(jù)的劃分,每一被劃分的集合稱為概念,利用已知的知識(shí)庫(kù)來(lái)處理或刻畫不精確或不確定的知識(shí)。粗糙集用于特征歸約和相關(guān)分析?! 。?)模糊集方法?;谝?guī)則的分類系統(tǒng)有一個(gè)缺點(diǎn):對(duì)于連續(xù)屬性,他們有陡峭的截?cái)?。將模糊邏輯引入,允許定義“模糊”邊界,提供了在高抽象層處理的便利?! ∑渌€有貝葉斯網(wǎng)絡(luò)、可視化技術(shù)、臨近搜索方法和公式發(fā)現(xiàn)等方法?! ?.?dāng)?shù)據(jù)挖掘常用的分析方法?! 。?)分類和預(yù)測(cè)。分類和預(yù)測(cè)是兩種數(shù)據(jù)分析形式,可以用于提取描述重要數(shù)據(jù)類的模型或預(yù)測(cè)
5、未來(lái)的數(shù)據(jù)趨勢(shì)。數(shù)據(jù)分類(dataclassfication)是一個(gè)兩步過程,第一步,建立一個(gè)模型,描述預(yù)定的數(shù)據(jù)類集或概念集,通過分析有屬性描述的數(shù)據(jù)庫(kù)元組來(lái)構(gòu)造模型。第二步,使用模型進(jìn)行分類。首先評(píng)估模型的預(yù)測(cè)準(zhǔn)確率,如果認(rèn)為模型的準(zhǔn)確率可以接受,就可以用來(lái)對(duì)類標(biāo)號(hào)未知的數(shù)據(jù)遠(yuǎn)祖或?qū)ο筮M(jìn)行分類?! ☆A(yù)測(cè)是構(gòu)造和使用模型評(píng)估無(wú)標(biāo)號(hào)樣本類,或評(píng)估給定樣本可能具有的屬性值或值區(qū)間。分類和預(yù)測(cè)具有廣泛的應(yīng)用,如信譽(yù)證實(shí)、醫(yī)療診斷、性能預(yù)測(cè)和選擇購(gòu)物。分類和預(yù)測(cè)常用的算法包括決策樹歸納、貝葉斯分類、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、K-最臨近分類、遺傳算法、粗糙集和模糊集技術(shù)?! 。?)聚類分析。聚
6、類是將數(shù)據(jù)對(duì)象分組成為多個(gè)類或簇(cluster),在同一個(gè)簇中的對(duì)象之間具有較高的相似度,而不同簇中的對(duì)象差別較大。作為統(tǒng)計(jì)學(xué)的一個(gè)分支,聚類分析已被廣泛的研究了許多年,現(xiàn)在主要集中在基于距離的聚類分析,基于k-means(k-平均值)、k-medoids(k-中心點(diǎn))和其他的一些聚類分析工具也有不少的應(yīng)用?! 。?)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘給定數(shù)據(jù)集中項(xiàng)之間的有趣聯(lián)系。設(shè)I={i1,i2,…im}是項(xiàng)的集合,任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫(kù)事務(wù)的集合,其中每個(gè)事務(wù)T是項(xiàng)的集合,使得T包含于I。關(guān)聯(lián)規(guī)則是形如A=>B的蘊(yùn)涵式,其中A∈I,B∈I,并且A∩B為空。關(guān)聯(lián)規(guī)則的挖掘分成兩步
7、:①找出所有頻繁項(xiàng)集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持計(jì)數(shù)一樣。②由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿足最小支持度和最小置信度?! 。?)序列模式。序列模式分析和關(guān)聯(lián)規(guī)則分析類似,也是為了挖掘數(shù)據(jù)項(xiàng)之間的聯(lián)系,不過序列模式分析的是數(shù)據(jù)項(xiàng)在時(shí)間維上的先后序列關(guān)系,如一個(gè)顧客在購(gòu)買了計(jì)算機(jī)半年后可能再購(gòu)買財(cái)務(wù)分析軟件?! 。?)孤立點(diǎn)分析。孤立點(diǎn)是度量錯(cuò)誤或固有的數(shù)據(jù)變異性的結(jié)果。許多數(shù)據(jù)挖掘算法都試圖使孤立點(diǎn)的影響最小,或排除它們。一個(gè)人的噪聲可能是另一個(gè)