資源描述:
《數(shù)據(jù)挖掘技術(shù)在crm中的應(yīng)用論文》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用論文摘要:本文闡述了CRM的內(nèi)涵和外延及數(shù)據(jù)挖掘技術(shù)常用的算法和分析方法,并在此基礎(chǔ)上重點(diǎn)分析了數(shù)據(jù)挖掘技術(shù)在CRM中的功能和應(yīng)用。關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘;知識(shí)發(fā)現(xiàn);客戶(hù)關(guān)系管理一、CRM的概念經(jīng)過(guò)20多年的發(fā)展,市場(chǎng)經(jīng)濟(jì)的觀(guān)念已深入人心,一些先進(jìn)企業(yè)的經(jīng)營(yíng)理念正在經(jīng)歷著從以產(chǎn)品為中心向以客戶(hù)為中心的轉(zhuǎn)移。在這種背景下,企業(yè)有必要對(duì)客戶(hù)的各種活動(dòng)和信息進(jìn)行集成,實(shí)現(xiàn)對(duì)客戶(hù)的全面管理,這就是所謂的“客戶(hù)關(guān)系管理”(CRM)??蛻?hù)關(guān)系管理(CRM)源于以客戶(hù)為中心的商業(yè)模式,其通過(guò)對(duì)客戶(hù)關(guān)系的有效管理.freels)。遺傳算法根據(jù)適
2、者生存的原則,形成由當(dāng)前群體中最適合的規(guī)則組成新的群體,以及這些規(guī)則的后代。遺傳算法用于分類(lèi)和其他優(yōu)化問(wèn)題。(4)粗糙集方法。粗糙集方法基于給定訓(xùn)練數(shù)據(jù)內(nèi)部的等價(jià)類(lèi)的建立。它將知識(shí)理解為對(duì)數(shù)據(jù)的劃分,每一被劃分的集合稱(chēng)為概念,利用已知的知識(shí)庫(kù)來(lái)處理或刻畫(huà)不精確或不確定的知識(shí)。粗糙集用于特征歸約和相關(guān)分析。(5)模糊集方法。基于規(guī)則的分類(lèi)系統(tǒng)有一個(gè)缺點(diǎn):對(duì)于連續(xù)屬性,他們有陡峭的截?cái)唷⒛:壿嬕?,允許定義“模糊”邊界,提供了在高抽象層處理的便利。其它還有貝葉斯網(wǎng)絡(luò)、可視化技術(shù)、臨近搜索方法和公式發(fā)現(xiàn)等方法。2.?dāng)?shù)據(jù)挖掘常用的分析方法。(1)分類(lèi)和預(yù)測(cè)。分類(lèi)和
3、預(yù)測(cè)是兩種數(shù)據(jù)分析形式,可以用于提取描述重要數(shù)據(jù)類(lèi)的模型或預(yù)測(cè)未來(lái)的數(shù)據(jù)趨勢(shì)。數(shù)據(jù)分類(lèi)(dataclassfication)是一個(gè)兩步過(guò)程,第一步,建立一個(gè)模型,描述預(yù)定的數(shù)據(jù)類(lèi)集或概念集,通過(guò)分析有屬性描述的數(shù)據(jù)庫(kù)元組來(lái)構(gòu)造模型。第二步,使用模型進(jìn)行分類(lèi)。首先評(píng)估模型的預(yù)測(cè)準(zhǔn)確率,如果認(rèn)為模型的準(zhǔn)確率可以接受,就可以用來(lái)對(duì)類(lèi)標(biāo)號(hào)未知的數(shù)據(jù)遠(yuǎn)祖或?qū)ο筮M(jìn)行分類(lèi)。預(yù)測(cè)是構(gòu)造和使用模型評(píng)估無(wú)標(biāo)號(hào)樣本類(lèi),或評(píng)估給定樣本可能具有的屬性值或值區(qū)間。分類(lèi)和預(yù)測(cè)具有廣泛的應(yīng)用,如信譽(yù)證實(shí)、醫(yī)療診斷、性能預(yù)測(cè)和選擇購(gòu)物。分類(lèi)和預(yù)測(cè)常用的算法包括決策樹(shù)歸納、貝葉斯分類(lèi)、貝葉斯網(wǎng)絡(luò)
4、、神經(jīng)網(wǎng)絡(luò)、K-最臨近分類(lèi)、遺傳算法、粗糙集和模糊集技術(shù)。(2)聚類(lèi)分析。聚類(lèi)是將數(shù)據(jù)對(duì)象分組成為多個(gè)類(lèi)或簇(cluster),在同一個(gè)簇中的對(duì)象之間具有較高的相似度,而不同簇中的對(duì)象差別較大。作為統(tǒng)計(jì)學(xué)的一個(gè)分支,聚類(lèi)分析已被廣泛的研究了許多年,現(xiàn)在主要集中在基于距離的聚類(lèi)分析,基于k-means(k-平均值)、k-medoids(k-中心點(diǎn))和其他的一些聚類(lèi)分析工具也有不少的應(yīng)用。(3)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘給定數(shù)據(jù)集中項(xiàng)之間的有趣聯(lián)系。設(shè)I={i1,i2,.freel}是項(xiàng)的集合,任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫(kù)事務(wù)的集合,其中每個(gè)事務(wù)T是項(xiàng)的集合,使得T包含于
5、I。關(guān)聯(lián)規(guī)則是形如A=B的蘊(yùn)涵式,其中A∈I,B∈I,并且A∩B為空。關(guān)聯(lián)規(guī)則的挖掘分成兩步:①找出所有頻繁項(xiàng)集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持計(jì)數(shù)一樣。②由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿(mǎn)足最小支持度和最小置信度。(4)序列模式。序列模式分析和關(guān)聯(lián)規(guī)則分析類(lèi)似,也是為了挖掘數(shù)據(jù)項(xiàng)之間的聯(lián)系,不過(guò)序列模式分析的是數(shù)據(jù)項(xiàng)在時(shí)間維上的先后序列關(guān)系,如一個(gè)顧客在購(gòu)買(mǎi)了計(jì)算機(jī)半年后可能再購(gòu)買(mǎi)財(cái)務(wù)分析軟件。(5)孤立點(diǎn)分析。孤立點(diǎn)是度量錯(cuò)誤或固有的數(shù)據(jù)變異性的結(jié)果。許多數(shù)據(jù)挖掘算法都試圖使孤立點(diǎn)的影響最小,或排除它們。一個(gè)人的噪聲可能是另一個(gè)人的信號(hào),
6、在有些時(shí)候,孤立點(diǎn)是非常有用的。孤立點(diǎn)挖掘可以描述如下:給定一個(gè)n個(gè)數(shù)據(jù)點(diǎn)或?qū)ο蟮募?,以及預(yù)期的孤立點(diǎn)的數(shù)目k,發(fā)現(xiàn)與剩余的數(shù)據(jù)相比是顯著相異的或不一致的頭k個(gè)對(duì)象。孤立點(diǎn)探測(cè)方法可分為三類(lèi):統(tǒng)計(jì)學(xué)方法,基于距離的方法和基于偏移的方法。三、數(shù)據(jù)挖掘在客戶(hù)關(guān)系管理中的應(yīng)用1.客戶(hù)細(xì)分??蛻?hù)細(xì)分是指將一個(gè)大的客戶(hù)群體劃分為多個(gè)較小的客戶(hù)群體,在每個(gè)劃分后的客戶(hù)群體中,客戶(hù)在某個(gè)或幾個(gè)屬性值上具有高度的相似性,而在不同的群體之間客戶(hù)則差別較大。對(duì)一個(gè)商業(yè)銀行來(lái)說(shuō),如果問(wèn)“誰(shuí)是企業(yè)客戶(hù)?誰(shuí)是私人客戶(hù)?”應(yīng)該是一個(gè)容易回答的問(wèn)題,但根據(jù)消費(fèi)行為,“客戶(hù)可以分為哪幾個(gè)群
7、體?”卻不是容易回答的問(wèn)題。事實(shí)上,每個(gè)客戶(hù)都有一系列的相關(guān)屬性,而對(duì)一些企業(yè)來(lái)說(shuō)重要的分類(lèi)需綜合一系列屬性而非單個(gè)屬性來(lái)評(píng)判。數(shù)據(jù)挖掘中的聚類(lèi)方法,能夠幫助企業(yè)按照客戶(hù)的類(lèi)別、行業(yè)、區(qū)域、職業(yè)、收入等企業(yè)感興趣的各種條件細(xì)分市場(chǎng)??蛻?hù)細(xì)分是企業(yè)確定產(chǎn)品和服務(wù)的基礎(chǔ),也是建立一對(duì)一營(yíng)銷(xiāo)的基礎(chǔ)。2000年荷蘭銀行將客戶(hù)細(xì)分為頂級(jí)、重要、核心和大眾四類(lèi)客戶(hù)群,提供有針對(duì)性的差別服務(wù),營(yíng)業(yè)收入增長(zhǎng)了一倍以上。2.客戶(hù)獲得。獲取客戶(hù)的傳統(tǒng)方式一般是通過(guò)各種媒體廣告、散發(fā)傳單等吸引新客戶(hù),但是這種方式有著嚴(yán)重的缺陷,如不能做到有的放矢,造成資源浪費(fèi),預(yù)期效果不理想等.數(shù)
8、據(jù)挖掘中的分類(lèi)、聚類(lèi)技術(shù)可以幫助企業(yè)分