資源描述:
《探索數(shù)據(jù)挖掘技術(shù)及其在證券領(lǐng)域的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、i蓊器鋈自⑧天津大薯中目*代#一*★{博士學(xué)位論文一■啊●_嘎Ih'襯ll:gIF:III
2、1]l一級(jí)學(xué)科:i±簋扭丑主與撞盔學(xué)科專業(yè):i土簋扭應(yīng)旦撞壟作者姓名:王±指導(dǎo)教師:煎至鏖煎撞天津大學(xué)研究生院2005年12月中文捅要本論文從四個(gè)方面探討了數(shù)據(jù)挖掘理論與技術(shù)及其在證券領(lǐng)域的應(yīng)用。第一,研究用于客戶分析的聚類方法。通過(guò)挖掘客戶的歷史交易數(shù)據(jù),基于客戶關(guān)系管理理論提出并實(shí)現(xiàn)了證券行業(yè)的客戶劃分模型:客戶自動(dòng)聚類機(jī)制、同類別內(nèi)客戶分組機(jī)制以及模型動(dòng)態(tài)更新機(jī)制。在客戶自動(dòng)聚類機(jī)制的實(shí)現(xiàn)方面,建立了資金規(guī)模、手續(xù)費(fèi)收入、息差收入、操作頻率等四項(xiàng)指標(biāo)體系,通過(guò)對(duì)數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性分析定義了加權(quán)聚類
3、相似度公式,并通過(guò)對(duì)聚類結(jié)果的分析建立了證券行業(yè)的客戶聚類效果評(píng)價(jià)指標(biāo);在同類別內(nèi)客戶分組機(jī)制的實(shí)現(xiàn)方面,提出并實(shí)現(xiàn)了根據(jù)客戶的操作風(fēng)格使用動(dòng)態(tài)貝葉斯模型進(jìn)行客戶分組的方法。最后,使用CURE聚類算法實(shí)現(xiàn)了模型動(dòng)態(tài)更新機(jī)制。第二,提出并實(shí)現(xiàn)了運(yùn)用關(guān)聯(lián)規(guī)則和序列模式的挖掘構(gòu)造證券網(wǎng)上交易客戶行為模型的方法,并用該模型構(gòu)造Markov鏈轉(zhuǎn)移概率矩陣,實(shí)現(xiàn)了網(wǎng)上交易行情自動(dòng)推送算法,有效地提高客戶網(wǎng)上交易實(shí)時(shí)行情的響應(yīng)速度。第三,提出并實(shí)現(xiàn)了證券業(yè)客戶流失分析RFM—ROI模型,運(yùn)用信息論中信息增益理論對(duì)RFM-ROI模型進(jìn)行了基于數(shù)量分析的實(shí)證。根據(jù)RFM—ROI模型,在數(shù)據(jù)挖掘的基礎(chǔ)上用分類方
4、法構(gòu)建了客戶流失分析決策樹,歸納出證券行業(yè)客戶流失分析的業(yè)務(wù)規(guī)則,并提出了解決決策樹剪枝問(wèn)題的停止閾值方法。第四,運(yùn)用時(shí)間序列模式分析的概念和方法進(jìn)行股票趨勢(shì)的K線模式挖掘,提出了在短期趨勢(shì)預(yù)測(cè)中時(shí)間窗口匹配的插值算法,然后用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)挖掘出股市歷史走勢(shì)中隱含的時(shí)間序列模式。關(guān)鍵詞:客戶聚類、關(guān)聯(lián)規(guī)則和序列模式、客戶行為模型、客戶流失模型、決策樹、股票時(shí)間序列ABSTRACTInthisdoctoraldissertafion’wediSCUSSthetheoryandtechnologyofdataminingandtheirapplicationsinthesecuritiesf
5、ieldsforthefollowingfouraspects.First,weresearchontheclusteringmethodofcustomeranalysis.Throughminingcustomerhistoricaltransaction,weproposeandrealizethree109icalfunctionsofcustomerdivisionmodelbasedontheCustomerRelationsManagemcntfCRM):customerautomaticallyclusteringmechanism,customergroupingmecha
6、nisminthesameclusteringclass,anddynamicrenewalmechanismofthemodel.Inrealizationofcustomerautomaticallyclusteringmechanism,weestablishtheclusteringindicatorset,includingfourindicators:thecapitalscale,thecommission,theinterestbalanceincome,thetradingfrequency.Throughstatisticalco.elation鋤lysis.wedefi
7、netheweightofeveryindicatorusingtheclusteringsimilarityformula.a(chǎn)ndputforwardaperformanceindicatortoevaluatetheeffectofcustomerclusteringbyanalyzingtheresultofcustomerclustering.Inthesaintclass.weproposeandrealizecustomergroupingmethodaccordingtothecustomeroperationstylebyusingdynamicBayesmodel.Seco
8、ndly,weproposeandapplythemethodofconstructingcustomerbehaviormodelofInternetsecuritiesdealingsystembyminingassociationmlesandsequentialpaRcrusfromhistoficaltradingdatawarehouse.Intermsofthetransitionmatrixo