基于數(shù)據(jù)挖掘技術客戶流失預警模型

基于數(shù)據(jù)挖掘技術客戶流失預警模型

ID:5941857

大?。?7.50 KB

頁數(shù):6頁

時間:2017-12-29

基于數(shù)據(jù)挖掘技術客戶流失預警模型_第1頁
基于數(shù)據(jù)挖掘技術客戶流失預警模型_第2頁
基于數(shù)據(jù)挖掘技術客戶流失預警模型_第3頁
基于數(shù)據(jù)挖掘技術客戶流失預警模型_第4頁
基于數(shù)據(jù)挖掘技術客戶流失預警模型_第5頁
資源描述:

《基于數(shù)據(jù)挖掘技術客戶流失預警模型》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。

1、基于數(shù)據(jù)挖掘技術客戶流失預警模型  【摘要】結合客戶細分的思想,提出了一種基于慢啟動的頻繁模式挖掘算法,并基于該算法提出了一種新的電信企業(yè)客戶流失預警模型,湖南某大型電信企業(yè)基于該客戶流失預警,在其一個地市分公司進行了客戶維系與挽留二期工程的實施試點,試點結果表明,提出的客戶流失預警模型具有良好的預警功能。【關鍵詞】客戶流失客戶維系與挽留預警模型電信企業(yè)一、引言隨著電信企業(yè)之間的競爭加劇,電信運營商不斷推出新的套餐和新的業(yè)務,希望能夠爭取到更多的市場份額。但同時也在很大程度上加大了客戶的不穩(wěn)定性,使得客戶離網(wǎng)現(xiàn)象頻繁發(fā)

2、生。研究表明,一個公司如果將其顧客流失率降低5%,利潤就能增加25%至85%。由此可見,大量的客戶流失讓運營商蒙受巨大損失。結合客戶細分的思想,本文提出了一種新的電信企業(yè)客戶流失預警模型。二、相關定義(一)客戶流失的定義與分類6客戶流失只指客戶因為某些原因與電信運營商解除服務合同的行為。客戶解除服務合同的原因有多種多樣,但歸納起來主要有如下幾類:自然流失:是指客戶因為企業(yè)不能給提供所期望的產(chǎn)品和服務(如不能提供寬帶上網(wǎng)功能等)或者某些客觀因素(如到異地工作或下崗等)而選擇離網(wǎng)所導致的客戶流失;惡意流失:是指客戶因為個人

3、私欲因素(如惡意欠費后為了逃避繳費等)而選擇離網(wǎng)所導致的客戶流失;競爭流失:是指客戶因為企業(yè)競爭對手因素(如競爭對手提供了更優(yōu)惠的資費政策)而選擇離網(wǎng)所導致的客戶流失;失望流失:是指客戶因為企業(yè)服務質(zhì)量因素(如網(wǎng)絡覆蓋或服務態(tài)度等)而選擇離網(wǎng)所導致的客戶流失。三、客戶流失預警模型的構建(一)客戶細分客戶細分有多種方法,如依據(jù)客戶的性別、年齡、支付能力、信用度等均可對客戶進行分類。在客戶流失預警模型中,我們依據(jù)客戶對企業(yè)的貢獻大小進行分類,主要分為以下三種:高價值客戶、普通價值客戶、低價值客戶。假定企業(yè)每月均攤到每個客戶

4、的日常維護成本為C,則各類客戶定義如下:高價值客戶:是指月均話費大于等于kC的客戶;普通價值客戶:是指月均話費介于1C到kC之間的客戶;低價值客戶:是指月均話費小于1C的客戶。(二)模型數(shù)據(jù)屬性分析6影響客戶流失預警判定的數(shù)據(jù)屬性通常多種多樣,這些屬性之間存在著或強或弱的相關關系,以全部屬性作為細分標準顯然過于復雜,并且也難于在實時環(huán)境中識別和追溯目標;而任意選取其中某個或某幾個屬性又會影響對客戶流失行為的解釋力度,降低預警效果。因此,較為有效的方法是從這些相互關聯(lián)的影響屬性中,通過約簡算法抽取對客戶流失行為起關鍵影響

5、的屬性;或者對這些屬性進行抽取整合,重新構造少數(shù)關鍵指標,這些指標是原有影響屬性(或稱因子)的線性組合,能綜合原有影響屬性的最大信息,相互之間的相關性較小。(三)流失客戶的特征挖掘基于慢啟動的頻繁模式挖掘算法。在傳統(tǒng)的頻繁模式挖掘研究中,項(Item)是一個文字,在交易數(shù)據(jù)庫中,它可以代表商品,在分類時,它可以代表屬性的值。設I={Il,I2,...,Im}為項的全集,D={Tl,T2,...,Tn}為事務數(shù)據(jù)庫,其中,每個事務Ti(i[1,2,…,n])包含事務ID號TID和一個I中項的子集Itemset。定義一:I

6、的子集XI稱作項集或模式。項集X的支持度計數(shù)supes_count(X)為D中包含項集X的事務數(shù),X的支持度sup-port(X)=supes_count(X)/

7、D

8、,其中

9、D

10、是D中事務的個數(shù)。定義二:對于預先指定的最小支持度閥值δ6,如果項集(模式)X的支持度滿足:support(X)δ,則稱項集(模式)X是頻繁的。定義三(頻繁數(shù)):頻繁數(shù)是指在事務數(shù)據(jù)D中,數(shù)據(jù)項的支持度大于最小支持度閾值的所有數(shù)據(jù)項個數(shù)的總和,記為R。定義4(最高頻繁項次數(shù)):最高頻繁項次數(shù)是指在所有的頻繁模式中項數(shù)最高的頻繁項的項的個數(shù)值,

11、記為M。定義判決函數(shù)f為頻繁項次數(shù)和頻繁數(shù)的如下線性組合:f=αR+βM,其中,α和β為權重因子,滿足α+β=1?;谏鲜龉剑山o出基于慢啟動的頻繁模式挖掘算法的實現(xiàn)步驟如下:(1)最小支持度閾值指數(shù)遞增過程)Step1:取一個較小的δ值作為初始最小支持度閾值,根據(jù)式(1)計算判決函數(shù)f的值f1。……Stepi:取2i-1δ作為最小支持度閾值,計算判決函數(shù)值fi,若fi≤fi-1,轉(zhuǎn)入步驟i+1。Stepi+1:取2iδ作為最小支持度閾值,計算判決函數(shù)值fi+1,若fi+1>fi,轉(zhuǎn)入步驟i+2。(2)最小支持度閾值

12、線性遞增過程)Stepi+2:取2i-1δ+ζ作為最小支持度閾值,計算判決函數(shù)值fi+2,若fi+2≤fi,轉(zhuǎn)入步驟i+3?!璖tepi+1+k:取2i-1δ+(k-1)ζ作為最小支持度閾值,計算判決函數(shù)值fi+l+k,若fi+l+k>fi+k,結束。這樣最小支持度閾值線性遞增過程結束,得到最小的判決函數(shù)值fi+k,以及最終最小

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。