資源描述:
《基于數(shù)據(jù)挖掘技術(shù)在入侵檢測中的應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、中國人民公安大學(xué)基于數(shù)據(jù)挖掘技術(shù)在入侵檢測中的應(yīng)用學(xué)生:吳長有學(xué)號:201221450029專業(yè):網(wǎng)絡(luò)安全與執(zhí)法導(dǎo)師:中國人民公安大學(xué)網(wǎng)絡(luò)安全保衛(wèi)學(xué)院二Ο一三年四月VIII論文聲明本人鄭重聲明:1、此畢業(yè)論文是本人在指導(dǎo)教師指導(dǎo)下獨立進(jìn)行研究取得的成果。除了特別加以標(biāo)注和致謝的地方外,本文不包含其他人或其它機構(gòu)已經(jīng)發(fā)表或撰寫過的研究成果。對本文研究做出重要貢獻(xiàn)的個人與集體均已在文中作了明確標(biāo)明。本人完全意識到本聲明的法律結(jié)果由本人承擔(dān)。2、本人完全了解學(xué)校、學(xué)院有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校與學(xué)院保留并向國家有關(guān)部門或機構(gòu)送
2、交此論文的復(fù)印件和電子版,允許此文被查閱和借閱。本人授權(quán)中國人民公安大學(xué)網(wǎng)絡(luò)安全保衛(wèi)學(xué)院可以將此文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本文。3、若中國人民公安大學(xué)網(wǎng)絡(luò)安全保衛(wèi)學(xué)院發(fā)現(xiàn)本文有抄襲,一切后果均由本人承擔(dān),與指導(dǎo)老師無關(guān)。作者簽名:吳長有日期:二Ο一三年四月VIII摘要隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,越來越多的人使用網(wǎng)絡(luò),計算機網(wǎng)絡(luò)在為人們提供便利、帶來效益的同時,也使人類面臨著信息安全的巨大挑戰(zhàn)。在現(xiàn)代信息化發(fā)展的形式下,要求一個安全的網(wǎng)絡(luò)系統(tǒng)不僅要有防御手段,而是既要有防火墻等防御
3、的手段,還要有能對網(wǎng)絡(luò)的安全進(jìn)行實時監(jiān)控,攻擊與反攻擊的網(wǎng)絡(luò)入侵檢測系統(tǒng)。當(dāng)今網(wǎng)絡(luò)安全現(xiàn)狀是各種黑客事件、網(wǎng)絡(luò)犯罪、病毒一直處于不斷升級的階段,大型門戶網(wǎng)站、政府網(wǎng)站、企業(yè)網(wǎng)站,還有個體網(wǎng)民都成了這些違法犯罪份子入侵的對象,入侵種類之繁多、手段之豐富簡直令人防不勝防,網(wǎng)絡(luò)安全保衛(wèi)刻不容緩。于是入侵檢測系統(tǒng)應(yīng)運而生。隨著網(wǎng)絡(luò)入侵檢測技術(shù)的發(fā)展,使人們已著眼于將數(shù)據(jù)挖掘技術(shù)應(yīng)用于入侵檢測技術(shù)的發(fā)中,如果能夠完善的將數(shù)據(jù)挖掘技術(shù)應(yīng)用到網(wǎng)絡(luò)入侵檢測中,根據(jù)入侵檢測系統(tǒng)的具體特點,應(yīng)用數(shù)據(jù)挖掘的基本原理,將它們優(yōu)化的結(jié)合起來,這樣將會大提高入
4、侵檢測系統(tǒng)的性能。本文將對把數(shù)據(jù)挖掘技術(shù)運用到網(wǎng)絡(luò)入侵檢測技術(shù)中的現(xiàn)狀和未來發(fā)展趨勢進(jìn)行論述。關(guān)鍵字:信息安全網(wǎng)絡(luò)防火墻數(shù)據(jù)挖掘入侵檢測現(xiàn)狀發(fā)展趨勢VIII1,數(shù)據(jù)挖掘概況隨著信息技術(shù)的迅速發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴(kuò)大,從而產(chǎn)生了大量的數(shù)據(jù)。為了給決策者提供一個統(tǒng)一的全局視角,人們在許多領(lǐng)域建立了大量數(shù)據(jù)倉庫,然而這些大量的數(shù)據(jù)往往使人們無法辨別隱藏在其中的能對決策提供支持的信息,而傳統(tǒng)的查詢、報表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)據(jù),并從中抽取有價值的潛在知識,數(shù)據(jù)挖掘(DataMining)技
5、術(shù)由此應(yīng)運而生,數(shù)據(jù)挖掘技術(shù)也正是伴隨著數(shù)據(jù)倉庫技術(shù)的發(fā)展而逐步發(fā)展完善起來的。數(shù)據(jù)挖掘是一個以數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化四大支柱技術(shù)為基礎(chǔ)的網(wǎng)絡(luò)信息技術(shù)。我們知道,描述或說明一個算法設(shè)計分為三個部分:輸入、輸出和處理過程。數(shù)據(jù)挖掘算法的輸入是數(shù)據(jù)庫,算法的輸出是要發(fā)現(xiàn)的知識或模式,算法的處理過程則為設(shè)計具體的搜索方法。從算法的輸入、輸出和處理過程三個方面看,可以確定數(shù)據(jù)挖掘主要涉及三個方面:挖掘?qū)ο?、挖掘任?wù)、挖掘方法。挖掘?qū)ο蟀ㄈ舾煞N數(shù)據(jù)庫或數(shù)據(jù)源,例如關(guān)系數(shù)據(jù)庫、文本數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、歷史數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、
6、空間數(shù)據(jù)庫、時態(tài)數(shù)據(jù)庫、以及萬維網(wǎng)(WEB)等。挖掘方法可以粗分為:機器學(xué)習(xí)方法、統(tǒng)計方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫方法。機器學(xué)習(xí)可細(xì)分為:遺傳算法、集成學(xué)習(xí)、糾錯輸出編碼、聚類分析等。統(tǒng)計方法可細(xì)分為:回歸分析、判別分析等。神經(jīng)網(wǎng)絡(luò)方法可細(xì)分為:前向神經(jīng)網(wǎng)絡(luò)、自組織神經(jīng)網(wǎng)絡(luò)等。數(shù)據(jù)挖掘是指從大量數(shù)據(jù)集合中自動抽取隱藏在數(shù)據(jù)中的那些有用信息的非平凡過程,這些信息的表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等。它可以幫助決策者分析歷史數(shù)據(jù)及當(dāng)前數(shù)據(jù),并從中發(fā)現(xiàn)隱藏的關(guān)系和模式,進(jìn)而預(yù)測事物未來可能發(fā)生的動向。數(shù)據(jù)挖掘的過程也叫知識發(fā)現(xiàn)的過程,它是
7、一門涉及面很廣的交叉性新興學(xué)科。數(shù)據(jù)挖掘是一種新的信息處理技術(shù),其主要特點是對數(shù)據(jù)庫中的大量數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,并從中提取輔助決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘是知識發(fā)現(xiàn)(KDD)過程中的一個特定步驟,它用專門算法從數(shù)據(jù)中抽取模式(patterns),它并不是用規(guī)范的數(shù)據(jù)庫查詢語言(如SQL)進(jìn)行查詢,而是對查詢的內(nèi)容進(jìn)行模式的總結(jié)和內(nèi)在規(guī)律的搜索。我們都知道VIII傳統(tǒng)的查詢和報表處理只是得到事件發(fā)生的結(jié)果,并沒有深入研究發(fā)生的原因和事物發(fā)展的規(guī)律,而數(shù)據(jù)挖掘則主要了解發(fā)生的原因并總結(jié)出規(guī)律,并且以一定的置信度對未來
8、進(jìn)行預(yù)測,用來為決策者行為決策提供有利的支持。數(shù)據(jù)挖掘的方法有很多,應(yīng)用到入侵檢測領(lǐng)域主要有關(guān)聯(lián)分析,序列模式分析,分類分析和聚類分析四種。關(guān)聯(lián)分析即用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘,以關(guān)聯(lián)規(guī)則是發(fā)現(xiàn)交易數(shù)據(jù)庫中不同項之間的聯(lián)系,這些規(guī)則找出行