鏈接分析在金融監(jiān)管中的應(yīng)用分析

鏈接分析在金融監(jiān)管中的應(yīng)用分析

ID:28402000

大小:1.98 MB

頁數(shù):64頁

時(shí)間:2018-12-09

鏈接分析在金融監(jiān)管中的應(yīng)用分析_第1頁
鏈接分析在金融監(jiān)管中的應(yīng)用分析_第2頁
鏈接分析在金融監(jiān)管中的應(yīng)用分析_第3頁
鏈接分析在金融監(jiān)管中的應(yīng)用分析_第4頁
鏈接分析在金融監(jiān)管中的應(yīng)用分析_第5頁
資源描述:

《鏈接分析在金融監(jiān)管中的應(yīng)用分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、-域是密不可分的。鏈接分析中一種常用的基于圖論的方法就是最短路徑算法[6,7]。它是一種圖搜索算法,能夠通過計(jì)算權(quán)值在網(wǎng)絡(luò)中找到兩個(gè)節(jié)點(diǎn)之間的最優(yōu)路徑。傳統(tǒng)的最短路徑算法在很多領(lǐng)域都得以應(yīng)用:機(jī)器人動(dòng)作設(shè)計(jì)、網(wǎng)絡(luò)路由等等。經(jīng)典的最短路徑算法主要包括:(1)計(jì)算從單個(gè)源點(diǎn)到所有節(jié)點(diǎn)的最短路徑:Dijkstra算法,PFS算法。(2)計(jì)算從單個(gè)源點(diǎn)到單個(gè)目的節(jié)點(diǎn)的最短路徑:2-3Dijkstra算法。最短路徑的方法目的是找到兩個(gè)沒有直接關(guān)聯(lián)的實(shí)體之間的聯(lián)系,并且它們之間的路徑反映的是兩個(gè)實(shí)體之間最強(qiáng)的關(guān)聯(lián)。1.2.1.2基于網(wǎng)絡(luò)搜索引擎的方法

2、由于互聯(lián)網(wǎng)上的頁面之間存在著錯(cuò)綜復(fù)雜的引用與被引用的鏈接關(guān)系,所以鏈接分析被廣泛地應(yīng)用于網(wǎng)絡(luò)搜索引擎當(dāng)中。其中最著名是Page等人在1998年提出的PageRank算法[8-10]。PageRank是用于評(píng)測(cè)一個(gè)網(wǎng)頁“重要性”的一種方法。在揉合了諸如Title標(biāo)識(shí)和Keywords標(biāo)識(shí)等所有其它因素之后,網(wǎng)絡(luò)搜索引擎通過PageRank來調(diào)整結(jié)果,使那些更具“重要性”的網(wǎng)頁在搜索結(jié)果中令網(wǎng)站排名獲得提升,從而提高搜索結(jié)果的相關(guān)性和質(zhì)量。PageRank是基于這樣一個(gè)理論:當(dāng)從網(wǎng)頁A鏈接到網(wǎng)頁B時(shí),PageRank就認(rèn)為“網(wǎng)頁A投了網(wǎng)頁B一

3、票”。PageRank根據(jù)網(wǎng)頁的得票數(shù)評(píng)定其重要性。然而,除了考慮網(wǎng)頁得票數(shù)(即鏈接)的純數(shù)量之外,PageRank還要分析投票的網(wǎng)頁?!爸匾钡木W(wǎng)頁所投出的票就會(huì)有更高的權(quán)重,并且有助于提高其它網(wǎng)頁的“重要性”。此外,基于鏈接分析的搜索引擎排序算法還有Kleinberg提出的HITS算法。但無論是PageRank算法,還是HITS算法,目前對(duì)于這方面的分析都還很不成熟[11]。1.2.1.3基于鏈接的分類方法基于鏈接的分類最主要的應(yīng)用在社會(huì)網(wǎng)絡(luò)分析領(lǐng)域,其中中最著名的是J.Kubica等人在2002年提出的隨機(jī)鏈接和分組探測(cè)的模型[12

4、,13];同樣,也應(yīng)用于網(wǎng)頁的分類領(lǐng)域,它的目的是將網(wǎng)頁按照頁面的單詞,頁面之間的連接,錨文本和其他頁面或鏈接的屬性進(jìn)行分類;應(yīng)用于目錄學(xué)領(lǐng)域,依據(jù)被該論文引用的論文,引用該論文的論3------文以及與它一起被共同引用的論文,基于鏈接的分類被用于預(yù)測(cè)論文的分類;在流行病學(xué)領(lǐng)域,將具有同樣病癥的患者進(jìn)行分類,基于鏈接的分類用于預(yù)測(cè)疾病的類型[3]。1.2.1.2基于鏈接的聚類方法聚類是將數(shù)據(jù)對(duì)象分組成為多個(gè)類或簇(cluster),在同一個(gè)簇中的對(duì)象之間具有較高的相似度,而不同簇中的對(duì)象差別較大。傳統(tǒng)的聚類算法是將數(shù)據(jù)對(duì)象作為相互獨(dú)立的個(gè)

5、體按照它們的某一個(gè)或多個(gè)屬性值的相似性進(jìn)行分組,而實(shí)際上,現(xiàn)實(shí)世界的對(duì)象是通過各種途徑彼此相關(guān)的[14]。例如,在學(xué)術(shù)論文領(lǐng)域,論文就可能通過它們的作者或者是引用關(guān)系而聯(lián)系在一起?;阪溄拥木垲惙椒ň褪菍?shù)據(jù)對(duì)象之間的關(guān)聯(lián),例如關(guān)聯(lián)的類型,關(guān)聯(lián)的頻度,關(guān)聯(lián)的強(qiáng)弱等考慮到相似度的計(jì)算之中,這樣聚類之后的結(jié)果不僅能體現(xiàn)對(duì)象屬性之間的相似,還能體現(xiàn)對(duì)象之間的本來聯(lián)系。目前對(duì)鏈接分析技術(shù)的分析,主要集中在Web挖掘、犯罪線索挖掘和社會(huì)網(wǎng)絡(luò)分析領(lǐng)域。本文將在第二章詳細(xì)敘述目前鏈接分析在上述領(lǐng)域的應(yīng)用和具體算法。1.2.2現(xiàn)有軟件平臺(tái)隨著技術(shù)方法的進(jìn)

6、步和完善,一些用于作鏈接分析的軟件也應(yīng)運(yùn)而生:(1)SAS反洗錢平臺(tái)。首先對(duì)數(shù)據(jù)依據(jù)一套規(guī)則與事實(shí)進(jìn)行檢驗(yàn),其次,為客戶建立個(gè)性化的檔案,當(dāng)客戶交易不符合通常的模式系統(tǒng)就會(huì)發(fā)出警報(bào)。最后,數(shù)據(jù)還可以通過神經(jīng)網(wǎng)絡(luò)進(jìn)行分析,系統(tǒng)具有學(xué)習(xí)和預(yù)測(cè)功能。(2)Mantas公司的行為控制平臺(tái)。通過使用規(guī)則匹配以及文本挖掘等標(biāo)準(zhǔn)技術(shù),并結(jié)合一系列的技術(shù)和復(fù)雜算法,可以對(duì)賬號(hào)間隱蔽關(guān)系進(jìn)行鏈接分析。(3)FinCENAISystem[15,16]。已經(jīng)被應(yīng)用于美國財(cái)政部的反洗錢工作中,其中采用了數(shù)據(jù)庫記錄的合并以及鏈接分析的某些技術(shù)。(4)NetMap[

7、2,6]。澳大利亞一家公司利用鏈接分析技術(shù)開發(fā)的可用于營銷業(yè)、保險(xiǎn)業(yè)、犯罪調(diào)查等方面的軟件。能夠在大量數(shù)據(jù)中發(fā)現(xiàn)關(guān)聯(lián)并顯示關(guān)聯(lián)的意義,只能用于結(jié)構(gòu)化數(shù)據(jù);(5)COPLINKDetect[17-19]。采用的是基于概念空間的方法。每個(gè)概念空間可以看作一個(gè)網(wǎng)絡(luò),結(jié)點(diǎn)表示概念,而鏈接表示兩個(gè)概念共同出現(xiàn)的概率。4------(6)ClearForest[2]。利用文本挖掘和鏈接分析相結(jié)合的方法建立起co-occurrencelinks或semantic-links。(7)Google搜索引擎。Google搜索引擎中采用了基于鏈接分析的Page

8、Rank算法對(duì)搜索結(jié)果進(jìn)行排序。1.2.1.2主要分析工作由于在金融監(jiān)管中經(jīng)常需要分析賬戶之間的交易關(guān)系,以便從中發(fā)現(xiàn)異常資金轉(zhuǎn)移情況,所以鏈接分析技術(shù)在金融監(jiān)管中具有非常重要的作用。但目前分

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。