資源描述:
《基于關(guān)聯(lián)規(guī)則的入侵檢測算法綜述》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、基于關(guān)聯(lián)規(guī)則的入侵檢測算法綜述武玉剛1,2秦勇2宋繼光2,3楊忠明2(1.江蘇科技大學(xué)計算機(jī)與信息工程學(xué)院,江蘇鎮(zhèn)江212003;2.茂名學(xué)院信息與網(wǎng)絡(luò)中心,廣東茂名525000;3.太原理工大學(xué)計算機(jī)與軟件學(xué)院,山西太原030024)摘要:關(guān)聯(lián)規(guī)則是一種新型的數(shù)據(jù)挖掘方法。根據(jù)目前國內(nèi)國際的研究情況,針對關(guān)聯(lián)規(guī)則的特點,首先對關(guān)聯(lián)規(guī)則進(jìn)行了介紹,并對經(jīng)典Apriori算法做了描述。之后針對該算法的缺點,介紹了一些改進(jìn)算法。針對入侵檢測算法的缺點及其在入侵檢測方面的研究分別進(jìn)行了分析綜述,并對其改進(jìn)闡述。最后,指出了在該領(lǐng)域
2、需要進(jìn)一步研究的熱點問題。關(guān)鍵字:關(guān)聯(lián)規(guī)則;入侵檢測;數(shù)據(jù)挖掘TheOverviewofIntrusionDetectionAlgorithmsBasedonAssociationrulesWUYu-gang1,2QINYong2SONGJi-guang2,3YANGZhong-ming2(1.Dept.Computer&InformationEngineering,JiangSuUniversityofScience&Technology,Zhenjiang,Jiangsu212003;2Centerofinformati
3、on&networksMaominguniversity,Maoming,Guangdong525000;3Dept.ComputerScience,TaiYuanUniversityofTechnology,Taiyuan,Shanxi030024)Abstract:Associationruleisanewdataminingmethod.Underthecurrentsituationofdomesticandinternationalresearchforthecharacteristicsofassociation
4、rules,firstofallpairsofassociationruleswereintroduced,andmadetheclassicApriorialgorithmaredescribed.Aftertheaddresstheshortcomingsofthealgorithm,introducedsomeimprovingalgorithms.Thedisadvantagesfortheintrusiondetectionalgorithmanditsapplicationinintrusiondetection
5、researchsynthesiswereanalyzed,anditimprovementsaredescribed.Finally,pointedouttheneedforfurtherresearchinthisarea,ahotissue.KeyWords:associationrules;intrusiondetection;datamining中國分類號:TP3930.引言網(wǎng)絡(luò)安全,已經(jīng)變得至關(guān)重要。作為傳統(tǒng)網(wǎng)絡(luò)安全技術(shù)的補充,入侵檢測受到更多的重視。基于模式匹配、統(tǒng)計分析和完整性分析的傳統(tǒng)入侵檢測方法,逐漸不能
6、適應(yīng)快速發(fā)展的網(wǎng)絡(luò)安全技術(shù)。將關(guān)聯(lián)規(guī)則引入到入侵檢測中,可以適應(yīng)快速發(fā)展的網(wǎng)絡(luò)技術(shù)并提高入侵檢測的檢測效率。1.關(guān)聯(lián)規(guī)則介紹1.1關(guān)聯(lián)規(guī)則基本定義定義1(關(guān)聯(lián)規(guī)則)關(guān)聯(lián)規(guī)則(associationrule)是由Agrawal[1]等人首先提出的一個重要KDD研究課題,它反映了大量數(shù)據(jù)中項目集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。定義2(項)設(shè)I=是二進(jìn)制文字的集合,其中的元素稱為項(item)。定義3(支持度)記D為交易(transaction)T的集合,交易T是項的集合,并且TI。,其中(1)定義4(置信度),其中(2)定義5(強(qiáng)關(guān)聯(lián)
7、規(guī)則)是指挖掘出支持度和可信度分別大于用戶給定的最小支持度(min_supp)和最小可信度(min_conf)的關(guān)聯(lián)規(guī)則。定義6(頻繁項集)如果項集的出現(xiàn)頻率大于或等于min_supp與D中事務(wù)總數(shù)的乘積,則稱它為頻繁項集。定義7(興趣度)[2]規(guī)定R的興趣度為,(3)其中為,=。1.1Apriori算法Agrawal等于1993年首先提出了挖掘顧客交易數(shù)據(jù)庫中項集間的關(guān)聯(lián)規(guī)則,并設(shè)計了一個基本算法,其核心是基于頻集理論的遞推方法,即基于兩階段頻集思想的方法,將關(guān)聯(lián)規(guī)則的設(shè)計分解為兩個子問題:1)發(fā)現(xiàn)頻集。這個子問題是最重要
8、的,開銷最大,因此,各種算法主要致力于提高發(fā)現(xiàn)頻集的效率。2)根據(jù)所獲得的頻繁項集,產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。根據(jù)定義這些規(guī)則必須滿足信任度閾值。由于步驟2中的操作極為簡單,因此挖掘關(guān)聯(lián)規(guī)則的整個性能就由步驟1中的操作處理所決定。挖掘關(guān)聯(lián)規(guī)則的總體性能由第一步?jīng)Q定,第二步相對容易實現(xiàn)。首先產(chǎn)生頻繁1