資源描述:
《基于數(shù)據(jù)挖掘技術(shù)的crm系統(tǒng)——數(shù)據(jù)挖掘技術(shù)在交叉營銷和客戶細(xì)分中的應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、華東船舶工業(yè)學(xué)院碩士學(xué)位論文基于數(shù)據(jù)挖掘技術(shù)的CRM系統(tǒng)——數(shù)據(jù)挖掘技術(shù)在交叉營銷和客戶細(xì)分中的應(yīng)用姓名:王丹丹申請學(xué)位級別:碩士專業(yè):@指導(dǎo)教師:劉同明20030101基于數(shù)據(jù)挖掘技術(shù)的CRM系統(tǒng)數(shù)據(jù)挖掘技術(shù)在交叉營銷和客戶細(xì)分中的應(yīng)用摘要本課題將數(shù)據(jù)挖掘技術(shù)運(yùn)用到CRM客戶關(guān)系管理的交叉營銷和客戶細(xì)分模塊中利用統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)技術(shù)創(chuàng)建預(yù)測客戶行為的模型指導(dǎo)商業(yè)決策本課題的主要研究工作和成果有1提出了基于H-Struct的頻繁閉合項(xiàng)集挖掘算法H-C該算法將待挖掘數(shù)據(jù)庫中的記錄壓縮在動(dòng)態(tài)鏈接結(jié)構(gòu)H-Struct中并在挖掘的過程
2、中通過自動(dòng)調(diào)整鏈接結(jié)構(gòu)適應(yīng)下一步挖掘同時(shí)該算法還克服了傳統(tǒng)頻繁項(xiàng)集生成算法需要多次掃描數(shù)據(jù)庫的缺點(diǎn)整個(gè)挖掘過程只需對數(shù)據(jù)庫進(jìn)行兩遍掃描另外由于H-C算法僅僅挖掘頻繁閉合項(xiàng)集使得該算法在提高挖掘效率的同時(shí)大大減少冗余關(guān)聯(lián)規(guī)則的產(chǎn)生實(shí)驗(yàn)表明H-C算法在不同最小支持度閾值下的處理效率及不同數(shù)據(jù)量大小下的擴(kuò)展性能優(yōu)于傳統(tǒng)的頻繁閉合項(xiàng)集挖掘算法2進(jìn)一步改進(jìn)了H-C算法首先針對傳統(tǒng)最小支持度閾值不利于發(fā)現(xiàn)長項(xiàng)集和具有低支持度高興趣度項(xiàng)集的缺點(diǎn)引入局部相對最小支持度閾值指導(dǎo)挖掘其次設(shè)置全局最大支持度閾值幫助去除那些出現(xiàn)過于頻繁的無用項(xiàng)集減少
3、算法時(shí)間開銷最后本課題充分利用H-Struct動(dòng)態(tài)鏈接結(jié)構(gòu)的挖掘特點(diǎn)挖掘具有最大長度k的頻繁閉合項(xiàng)集實(shí)驗(yàn)表明改進(jìn)后的算法由于去除了很多高支持度的無用項(xiàng)集其挖掘效率與性能優(yōu)于原H-C算法3為了得到完備的規(guī)則集合有效地指導(dǎo)預(yù)測過程本課題挖掘包含負(fù)項(xiàng)的關(guān)聯(lián)規(guī)則同時(shí)對待挖掘關(guān)聯(lián)規(guī)則的形式進(jìn)行約束增強(qiáng)知識的實(shí)用性實(shí)例分析表明得到的關(guān)聯(lián)規(guī)則集合是正確有效的4將挖掘得到的關(guān)聯(lián)規(guī)則集合作為知識庫并在這些知識的啟發(fā)下運(yùn)用EMYCIN的推理機(jī)制對客戶數(shù)據(jù)進(jìn)行營銷預(yù)測獲得該客戶選擇這項(xiàng)產(chǎn)品或服務(wù)的可信度本課題擴(kuò)充了EMYCIN中的推理算法使之可以處
4、理后件為負(fù)項(xiàng)的規(guī)則實(shí)驗(yàn)結(jié)果表明了推理機(jī)制的合理與正確性5客戶細(xì)分模塊的數(shù)據(jù)挖掘應(yīng)用為決策樹分類本文選擇gini指數(shù)作為建樹時(shí)分裂屬性的選擇標(biāo)準(zhǔn)選擇MDL作為剪枝標(biāo)準(zhǔn)在剪枝的過程中通過限定最終決策樹的大小來保證決策樹的可理解性關(guān)鍵詞數(shù)據(jù)挖掘交叉營銷客戶細(xì)分關(guān)聯(lián)規(guī)則決策樹TheCRMSystemBasedonDataMiningTechniquesTheApplicationsofDataMiningTechniquesinTheCrossingMarketingandCustomersSegmentationABSTRACTIn
5、thisproject,weapplydataminingtechniquestocrossmarketingandcustomerssegmentationofCRMsystem,andbuildpredictivemodelforcustomers’activitywithstatisticsandmachinelearningtechniquestoguidecommercialdecision.Thecontentandachievementisshowingbelow:1.BasedonH-Struct,weputf
6、orwardanewfrequentcloseditemsetsalgorithmH-C.ThisalgorithmpoursthedatasetsintoH-Struct,anddynamicallyadjustslinksintheminingprocesstocaterfornextmining.Thisalgorithmovercomesthedisadvantageofmany-timedatabase-scans,whichisapropertyofthetraditionalalgorithmsandaccomp
7、lishestheminingprocesswithintwo-timescansonoriginaldatabase.Becausefrequentcloseditemsetsisincorporated,theH-Calgorithmsnotonlysubstantiallyreducesthenumberofredundantrulesbutalsohasthepowerofrapidminingallfrequentcloseditemsets.OurtestsindicatethatH-Cismoreefficien
8、tandmorepreferablethanthepreviouslyproposedmethodswhenprocessingdifferent-scaleanddifferent-supporting-thresholddatabases.2.H-Calgorithmis