基于n-gram與加權(quán)分類器集成的惡意代碼檢測

基于n-gram與加權(quán)分類器集成的惡意代碼檢測

ID:31199201

大?。?82.92 KB

頁數(shù):17頁

時(shí)間:2019-01-07

基于n-gram與加權(quán)分類器集成的惡意代碼檢測_第1頁
基于n-gram與加權(quán)分類器集成的惡意代碼檢測_第2頁
基于n-gram與加權(quán)分類器集成的惡意代碼檢測_第3頁
基于n-gram與加權(quán)分類器集成的惡意代碼檢測_第4頁
基于n-gram與加權(quán)分類器集成的惡意代碼檢測_第5頁
資源描述:

《基于n-gram與加權(quán)分類器集成的惡意代碼檢測》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、基于N-Gram與加權(quán)分類器集成的惡意代碼檢測王衛(wèi)紅朱雨辰浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院摘要:提出網(wǎng)頁惡意腳本代碼的監(jiān)測系統(tǒng),將惡意腳本用V8引擎編譯成機(jī)器碼,用變長N-Gram模型對其進(jìn)行數(shù)據(jù)處理,提取特征形成樣本訓(xùn)練集?分別與隨機(jī)森林、邏輯回歸及樸素貝葉斯等分類器組合創(chuàng)建分類模型?研究將多個(gè)經(jīng)過訓(xùn)練集訓(xùn)練的分類模型集成,提出加權(quán)分類器集成的方式,每個(gè)分類器設(shè)定不同權(quán)值?通過實(shí)驗(yàn)分析,試驗(yàn)多種分類器組合,并通過訓(xùn)練集找出最優(yōu)權(quán)值分配.通過比較單個(gè)分類器和其他集成方式,結(jié)果證明訓(xùn)練過的加權(quán)集成分類器的方式能更準(zhǔn)確地檢測網(wǎng)頁存在惡意行為的代碼,有較高的準(zhǔn)確率.關(guān)鍵詞:惡意代碼;N-Gra

2、m;機(jī)器學(xué)習(xí);作者簡介:王衛(wèi)紅(1969—),男,浙江臨海人,教授,研究方向?yàn)榭臻g信息服務(wù)和網(wǎng)絡(luò)信息安全,E-mail:wh@zjut.cdu.cn.收稿日期:2017-02-20ThemaliciousscriptcodedetectionbasedonN-GramandweightedclassifierintegrationWANGWeihongZHUYuchenCollegeofComputerScienceandTechnology,ZhejiangUniversityofTechnology;Abstract:Thispaperproposesastaticmonitorin

3、gsystemfordetectingmaliciousscriptcode.Inthissystem,maliciousscriptcodeiscompiledintomachinecodewithV8enginesandtheN-Grammodelisusedtoprocessthemachinecodeandthefeaturesareextractedtoformthesampletrainingset.Theclassifiedtionmodeliscrcatedbycombiningwithrandomforest,logisticregression,NaiveBayesc

4、lassifierrespectively.Inthispaper,classificationmodelswhicharetrainedinmultipletrainingsetsareintegratedandawayofweightedclassifierintegrationisproposed.Eachclassifierissetadifferentweights.Throughexperimentaianalysis,avarietyofclassifiersarecombinedandtested,andtheoptimalweightisfoundthroughthet

5、rainingset.assignnient.Bycomparingtheindividualclassifierandotherintegratedapproach,theresultsshowthatthetrainedweightedclassifierscanbemoreaccuratetodetectmaliciouscodeandhavehigheraccuracy.Keyword:maliciousscript;N-Gram;machinelearning;Received:2017-02-20隨著Web應(yīng)用的發(fā)展,計(jì)算機(jī)和網(wǎng)絡(luò)的覆蓋面越來愈大,網(wǎng)絡(luò)在人們的?;钪幸渤蔀樵絹?/p>

6、越重要的一部分?它改善了人們的衣食住行,人們享受著網(wǎng)絡(luò)帶來的便利,也對網(wǎng)絡(luò)產(chǎn)生越來越多的依賴.截至2016年6月,中國的網(wǎng)民數(shù)量已經(jīng)達(dá)到7.10億,上半年增加了2132萬人,增長率為3.1%.我國網(wǎng)絡(luò)的普及率達(dá)到51.7%,與全球平均相比,高出3.1個(gè)百分點(diǎn),和亞洲平均水平相較,超過8.1個(gè)百分點(diǎn),與2015年底相比提高1.3個(gè)百分點(diǎn)人們越來越習(xí)慣網(wǎng)上支付,享受著線上支付的便捷?同時(shí),在線教育、在線政務(wù)服務(wù)以及其他線上的服務(wù)越來越多?然而不法分子在網(wǎng)絡(luò)的飛速發(fā)展屮看到了可乘Z機(jī)?許多不法分子利用不法手段破壞網(wǎng)絡(luò)安全,謀取經(jīng)濟(jì)利益,而網(wǎng)站上存在的漏洞成為了他們攻擊的目標(biāo),網(wǎng)絡(luò)的飛速發(fā)展也為

7、他們提供良好的溫床?黑客使用各種類型攻擊計(jì)算機(jī)和通信設(shè)施?啟動(dòng)這些攻擊的常見方法是通過惡意軟件(惡意軟件),例如蠕蟲、病毒和特洛伊木馬,它們在傳播吋可能對私人用戶、商業(yè)公司和政府造成嚴(yán)重?fù)p害?啟動(dòng)這些攻擊的常見方法是通過惡意網(wǎng)站,惡意網(wǎng)站的代碼往往包含病毒、蠕蟲或者特洛伊木馬?反病毒供應(yīng)商每天都而臨大量(數(shù)千)可疑文件?這些文件從各種來源收集,包括專用蜜罐,第三方提供程序或者用戶提交的報(bào)告文件?高效并且有效地檢查大量的文件是一個(gè)龐大

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。