數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究

數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究

ID:35506553

大?。?7.10 KB

頁數(shù):5頁

時(shí)間:2019-03-25

數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究_第1頁
數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究_第2頁
數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究_第3頁
數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究_第4頁
數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究_第5頁
資源描述:

《數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中的應(yīng)用研究【摘要】數(shù)據(jù)挖掘技術(shù)在法人庫系統(tǒng)中應(yīng)用,充分利用現(xiàn)有源數(shù)據(jù),發(fā)現(xiàn)隱含在數(shù)據(jù)倉庫中的隱含規(guī)則和知識(shí),對(duì)法人數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析和預(yù)測(cè),從而有效地利用法人庫數(shù)據(jù)為社會(huì)服務(wù)?!娟P(guān)鍵詞】數(shù)據(jù)挖掘;法人庫;知識(shí);OLAP1引言隨著科學(xué)技術(shù)的發(fā)展,數(shù)據(jù)成為一項(xiàng)越來越被重視的戰(zhàn)略資源。以法人信息為基礎(chǔ)載體,解決各事業(yè)單位間存在的“信息孤島”問題的法人單位基礎(chǔ)信息數(shù)據(jù)庫。在開發(fā)利用之初,就以為政府和社會(huì)服務(wù)為目標(biāo),充分融合利用現(xiàn)有數(shù)據(jù)資源,成功利用先進(jìn)的數(shù)據(jù)發(fā)掘手段發(fā)現(xiàn)隱含在數(shù)據(jù)倉庫中的隱含規(guī)則,通過數(shù)據(jù)多重分析模型建立起關(guān)鍵數(shù)據(jù)項(xiàng)的預(yù)

2、測(cè)。2法人單位基礎(chǔ)信息數(shù)據(jù)庫2.1法人數(shù)據(jù)法人庫數(shù)據(jù)包含了描述一個(gè)單位的基本特征的信息,以組織機(jī)構(gòu)代碼作為數(shù)據(jù)庫中所有單位的唯一的、始終不變的標(biāo)識(shí),采集工商、民政、編辦、國(guó)稅、地稅和質(zhì)監(jiān)的數(shù)據(jù),通過數(shù)據(jù)橋接、共亨、交換和比對(duì)后形成最終的法人基礎(chǔ)信息數(shù)據(jù)庫,法人庫信息分為基本元素信息和擴(kuò)展元索信息兩大類?;驹餍畔⑹侵阜ㄈ藥旎A(chǔ)信息,包括:組織機(jī)構(gòu)代碼、法人名稱等9項(xiàng)法人基本信息。法人擴(kuò)展元素信息是指除法人基本信息外部門間共享需求較為普遍的法人信息,包括組織機(jī)構(gòu)代碼信息、注冊(cè)或登記信息、稅務(wù)登記信息、統(tǒng)計(jì)信息4大類等34項(xiàng)。法人庫信息具有權(quán)威性、準(zhǔn)確性、完整性、動(dòng)態(tài)性及易于應(yīng)用的特性。法

3、人庫數(shù)據(jù)是穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)集合,可用以支持管理決策、宏觀預(yù)測(cè)。2.2法人庫系統(tǒng)法人庫系統(tǒng)市業(yè)務(wù)部門、交換平臺(tái)、管理服務(wù)和應(yīng)用服務(wù)四個(gè)層次組成,包含數(shù)據(jù)橋接系統(tǒng)、數(shù)據(jù)交換平臺(tái)、數(shù)據(jù)比對(duì)系統(tǒng)、安全管理中心、Web發(fā)布系統(tǒng)、數(shù)據(jù)挖掘分析系統(tǒng)六個(gè)主要組成系統(tǒng)。主要采用IP技術(shù)組建網(wǎng)絡(luò);基于J2EE組件開發(fā)軟件,整合各個(gè)系統(tǒng);基于SOA應(yīng)用集成開發(fā)框架。法人庫系統(tǒng)將一些基本業(yè)務(wù)功能實(shí)現(xiàn)為一組細(xì)粒度基礎(chǔ)服務(wù),被高層業(yè)務(wù)組裝共享。3數(shù)據(jù)挖掘技術(shù)在法人庫中的應(yīng)用3.1數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)是從數(shù)據(jù)倉庫中獲取高可信度知識(shí),發(fā)現(xiàn)人們不易察覺的隱含模式。法人基本信息項(xiàng)包含法人數(shù)量、注冊(cè)資本、類型、所

4、屬行業(yè)、經(jīng)營(yíng)范圍、成立FI期等信息,通過聚類分析、正態(tài)分布分析、回歸分析、吋間序列分析等方法,法人庫數(shù)據(jù)挖掘系統(tǒng)主要挖掘法人信息中包含的潛在信息,如法人存在的牛命周期長(zhǎng)短、區(qū)域內(nèi)法人數(shù)量的變化趨勢(shì)、各種類型法人的發(fā)展?fàn)顩r等進(jìn)行預(yù)測(cè)分析,并以圖形報(bào)表的方式進(jìn)行展現(xiàn)。主要功能包括法人單位數(shù)量變化時(shí)間序列分析、法人生命周期預(yù)測(cè)分析、法人行業(yè)類型預(yù)測(cè)分析、法人經(jīng)營(yíng)范圍分類分析、法人注冊(cè)資本分析。數(shù)據(jù)挖掘流程是首先從前置機(jī)共享數(shù)據(jù),通過比對(duì)系統(tǒng)對(duì)采集數(shù)據(jù)進(jìn)行比對(duì)入庫形成原始的法人庫源知識(shí)數(shù)據(jù),從而完成了低層知識(shí)數(shù)據(jù)的收集及獲取;乂根據(jù)分析需求,通過數(shù)據(jù)清洗、整理、分類、關(guān)聯(lián)等數(shù)據(jù)處理手段完成高層級(jí)

5、知識(shí)數(shù)據(jù)的加工提取,通過對(duì)目標(biāo)分析的數(shù)據(jù)表的建立、分析及預(yù)測(cè)、完成…個(gè)簡(jiǎn)單的數(shù)據(jù)挖掘過程;分析預(yù)測(cè)過程利用調(diào)整分析模型,剔除數(shù)據(jù)中不正常數(shù)據(jù)等方法使數(shù)據(jù)挖掘過程與數(shù)據(jù)模型想匹配,辨別所得到的是否是知識(shí)則需將得到的結(jié)果信息化或可視化,然后與現(xiàn)有的知識(shí)和結(jié)合比較。3.2OLAP在線分析OLAP聯(lián)機(jī)分析處理是面向分析的信息處理的數(shù)據(jù)處理方式,星形/雪花面向主的題數(shù)據(jù)庫設(shè)計(jì),具有匯總、統(tǒng)一、多維的特點(diǎn),儲(chǔ)存跨吋間維護(hù)歷史數(shù)據(jù),支持復(fù)雜查詢、以匯總和多維的方式輸出信息,為領(lǐng)導(dǎo)、主管或分析員提供長(zhǎng)期信息需求和決策支持。數(shù)據(jù)庫中的數(shù)據(jù)是按照各種主題組織。主題在數(shù)據(jù)倉庫中的物理實(shí)現(xiàn)是一系列的相關(guān)表。面向

6、主題的數(shù)據(jù)組織方式可在較高層次上對(duì)分析對(duì)象的數(shù)據(jù)給出完整、一致的描述,能完整、統(tǒng)一的刻畫各個(gè)分析對(duì)象所涉及的企業(yè)的各項(xiàng)數(shù)據(jù)以及數(shù)據(jù)之間的聯(lián)系,從而適應(yīng)各個(gè)部門的業(yè)務(wù)活動(dòng)特點(diǎn)和數(shù)據(jù)的動(dòng)態(tài)特征,從根本上實(shí)現(xiàn)數(shù)據(jù)與應(yīng)用的分離。法人庫數(shù)據(jù)挖掘系統(tǒng)OLAP在線分析通過法人類型、經(jīng)濟(jì)行業(yè)、經(jīng)濟(jì)類型、注冊(cè)資本等維度對(duì)法人信息進(jìn)行分析,以圖形、報(bào)表的方式展現(xiàn)給用戶。3.3數(shù)據(jù)庫設(shè)計(jì)根據(jù)法人基本信息項(xiàng)建立數(shù)據(jù)挖掘法人數(shù)據(jù)庫表集,其中包含法人類型統(tǒng)計(jì)信息表、法人經(jīng)濟(jì)行業(yè)統(tǒng)計(jì)信息表、法人經(jīng)濟(jì)類型統(tǒng)計(jì)信息表、法人注冊(cè)資木統(tǒng)計(jì)信息表。表1為法人類型統(tǒng)計(jì)信息表。3.4代碼法人類型分析代碼創(chuàng)建表法人類型分析統(tǒng)計(jì)信息表

7、FRLX_COUNTcreatetableFRLXCOUNT(FRCODEVARCHAR(20)notnull,FRNAMEVARCHAR(40)notnull,FRNUMINTEGERnotnull,AREACODEVARCHAR(12)notnull,STAT_NDVARCHAR(4)notnull,STAT_YDVARCHAR(2)notnull)o3.5應(yīng)用分析20世紀(jì)80年代后期數(shù)據(jù)挖掘通過仔細(xì)分析大量數(shù)據(jù)來揭示有意義的新

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。