金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘

金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘

ID:38294558

大?。?75.10 KB

頁數(shù):26頁

時間:2019-06-07

金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘_第1頁
金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘_第2頁
金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘_第3頁
金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘_第4頁
金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘_第5頁
資源描述:

《金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘建構(gòu)信用卡評分模型之商業(yè)智慧流程鄭宇庭謝邦昌程兆慶臺灣政治大學(xué)資料採礦中心報告大綱研究目的分析工具建模流程結(jié)論與建議Q&A9/14/20212研究目的有效地篩選出償債能力不佳的個人信用卡客戶,依此開發(fā)出一套信用風(fēng)險系統(tǒng),以幫助銀行做出正確的核卡決策。這個系統(tǒng)的開發(fā)、維護、與更新的成本預(yù)期將比銀行現(xiàn)有系統(tǒng)的成本低。9/14/20213分析工具MicrosoftSQLSever2005價格自動化以及開發(fā)延伸程度目前SPSS跟微軟之間是採取合作的態(tài)度9/14/20214建模流程:CRISP-DMDATAMINING執(zhí)行階段商業(yè)理解資料理解資料準(zhǔn)

2、備建模評估發(fā)佈資料源DATAMINING處理流程9/14/20215圖表來源:楊自強企業(yè)如何應(yīng)用商業(yè)智慧來提昇執(zhí)行力與競爭力微軟商業(yè)智慧解決方案SSIS分析服務(wù)報表服務(wù)分析服務(wù)(DataMining)資料來源檢視表(DataSourceView)整合性服務(wù)(SSIS)商業(yè)理解資料理解資料準(zhǔn)備建模評估發(fā)佈資料源資料源9/14/20216圖表來源:楊自強企業(yè)如何應(yīng)用商業(yè)智慧來提昇執(zhí)行力與競爭力資料採礦無處不在商業(yè)問題Microsoft演算法預(yù)測類別變數(shù),例如行銷回應(yīng)、顧客流失、違約預(yù)測(巴塞爾資本協(xié)定IRB)…決策樹貝氏機率分類群集類神經(jīng)網(wǎng)路羅吉斯迴歸預(yù)測連續(xù)變數(shù),例

3、如預(yù)測銷售量、預(yù)測客戶價值變動、預(yù)測金融商品價格波動...迴歸樹時間序列類神經(jīng)網(wǎng)路預(yù)測序列,例如找出網(wǎng)站使用者的點選路徑模式、客戶繳款行為模式、商品購物順序時序群集找出產(chǎn)品交叉銷售關(guān)聯(lián)性,又稱為購物籃分析關(guān)聯(lián)規(guī)則決策樹找出潛在相似性,例如市場區(qū)隔、偵測晶圓瑕疵分配、文件分類、保險浮濫理賠偵測、偽卡偵測群集時序群集9/14/20217商業(yè)理解(BusinessUnderstanding)釐清商業(yè)問題目前呆帳率是多少?信用卡審核流程?信用卡評分模型=分類模型9/14/20218資料理解(DataUnderstanding)資料來源某銀行2000.1.1~2002.6.

4、30的信用卡資料資料內(nèi)容申請資料檔繳款紀(jì)錄檔總共有1220個變數(shù),502,333筆原始資料違約戶定義繳款期間曾經(jīng)有逾期60天以上未繳之卡戶9/14/20219建模流程圖選擇2001.4~2001.6原始資料清除遺漏值、異常值資料轉(zhuǎn)換誤差抽樣訓(xùn)練組測試組建模評估評估9/14/202110資料準(zhǔn)備(DataPreparation)選擇合理的建模變數(shù)基本資料性別、教育程度、職業(yè)別……聯(lián)合徵信中心(JCIC)的資料被查詢總家數(shù)、延遲月數(shù)比率……與銀行往來的資料申請卡別類型、有沒有使用扣款服務(wù)……9/14/202111資料準(zhǔn)備(DataPreparation)選擇合理的建模

5、時間時間間隔取為12個月至18個月清除遺漏值、異常值資料轉(zhuǎn)換連續(xù)型轉(zhuǎn)成離散型:被查詢總家數(shù)…合併變項太多之變數(shù):職業(yè)別…衍生新的變數(shù)9/14/202112類型變數(shù)名稱資料類型個人資料教育別類別型(2類)性別旗標(biāo)型行業(yè)別類別型(3類)職稱別類別型(3類)工作年資類別型(5類)緊急聯(lián)絡(luò)人與正卡關(guān)係類別型(4類)與銀行往來紀(jì)錄是否申請結(jié)餘代償旗標(biāo)型扣款帳號旗標(biāo)型金融聯(lián)合徵信中心<過去六個月>延遲月數(shù)比率連續(xù)型<過去六個月>循還月數(shù)比率連續(xù)型近一年M2次數(shù)整數(shù)型<最近一個月>近期是否逾期旗標(biāo)型負(fù)債所得比連續(xù)型有效卡張數(shù)類別型(3類)被查詢總家數(shù)類別型(4類)9/14/20

6、2113建模(Modeling)誤差抽樣(Over-Sampling)將稀有事件透過抽樣的方式將其比重提高多的少抽(Reduce):正常戶抽取率0.1違約戶抽取率1將資料分成訓(xùn)練組與測試組避免過度學(xué)習(xí)(Over-fitting)建模方法選擇羅吉斯迴歸、決策樹、類神經(jīng)網(wǎng)路9/14/202114DataMiningModelEvaluationDataMiningModelEvaluation分類矩陣橫軸為預(yù)測結(jié)果,縱軸為實際結(jié)果增益圖橫軸為名單百分比,縱軸為累積佔全體之百分比收益圖根據(jù)成本以及銷售成功利潤,並計算出累積利潤圖散佈圖針對連續(xù)變數(shù),可以利用此功能了解實際

7、值與預(yù)測值間之差異性以及預(yù)測之趨勢變動情形9/14/202116選擇“vTargetMail(dbo)”勾選需要比較之模型DataMiningModelEvaluation說明:在進行模型效益評估前必須先選入資料表,並在模型中勾選要進行評估比較之模型9/14/202117DataMiningModelEvaluation分類矩陣藉由分類矩陣進一步比較,判別兩模型的預(yù)測能力,由決策樹模型發(fā)現(xiàn),預(yù)測正確的資料有7103+5857=12960;而群集分析模型的正確預(yù)測資料為5395+5308=10703,也可看出決策樹分類結(jié)果較群集分析分類結(jié)果好9/14/202118D

8、ataMi

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。