資源描述:
《反竊密搜索檢查分析系統(tǒng)》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。
1、網(wǎng)絡反竊密搜索檢查分析系統(tǒng)設計背景隨著信息產(chǎn)業(yè)和互聯(lián)網(wǎng)建設的迅速發(fā)展,網(wǎng)絡已經(jīng)普及到經(jīng)濟、文化教育和社會生活等各個方面,在工作和生活上給人們帶來很大的便利。與此同時,由于相關的監(jiān)管手段沒有及時跟上,使境內(nèi)外一些不法分子利用網(wǎng)絡進行大肆煽動宣傳,滲透破壞,發(fā)布和竊取關鍵機密信息等活動,影響社會穩(wěn)定,危及國家安全。網(wǎng)絡反竊密搜索檢查分析系統(tǒng)是一個網(wǎng)絡信息收集和處理系統(tǒng),按預定的方式對網(wǎng)絡遍歷,對檢索結果進行分類、分析,快速準確的定位敏感信息位置。2系統(tǒng)總論網(wǎng)絡反竊密搜索檢查分析系統(tǒng)是一個主動收集、分析和處理網(wǎng)絡信息的網(wǎng)絡信息收集系統(tǒng)??傮w上,系統(tǒng)包括兩大功能部件:檢索引擎和管理
2、引擎。檢索引擎的功能是采用主動的方式,以不同的手段,如精確搜索、網(wǎng)絡普查等,遍歷網(wǎng)絡,發(fā)現(xiàn)并保存敏感性信息頁面或位置。管理引擎提供對信息的管理和系統(tǒng)的管理,主要包括對信息的二次檢索與涉密標記、數(shù)據(jù)備份與恢復、檢索方式與資源定義、身份管理和報表等功能。系統(tǒng)設計充分考慮到網(wǎng)絡數(shù)據(jù)海量的特點,支持分布式部署和網(wǎng)格計算,增加系統(tǒng)的適用性。3功能與特點強大的檢索功能,支持多種檢索方式支持多內(nèi)碼的網(wǎng)頁,自動識別和轉換頁面內(nèi)碼支持信息的分類和跟蹤功能多線程、多服務器分布式并行檢查支持無人值守的自動日程模式支持對特別的服務器如網(wǎng)絡論壇等的專門檢查支持搜索規(guī)則:多個關鍵字的有機邏輯組合多搜索
3、目標和搜索規(guī)則模板支持搜索過程自動記錄,斷網(wǎng)自動恢復搜索結果自動分類,二次快速定位檢索搜索過程自動優(yōu)化,有效減輕系統(tǒng)負荷4檢索引擎檢索引擎是系統(tǒng)的眼睛和手,它主動地從網(wǎng)絡上提取相關信息,發(fā)現(xiàn)并記錄敏感的信息或數(shù)據(jù),提供系統(tǒng)進一步處理的數(shù)據(jù)源。1.0系列版本的檢索引擎支持對HTTP協(xié)議網(wǎng)絡信息的檢索,主要包括精確搜索、網(wǎng)絡普查、專項搜索和主機探測等模塊。檢索引擎主機探測專項搜索網(wǎng)絡普查精確搜索系統(tǒng)按照需求,可以增加對其它協(xié)議的檢索支持特定信息跟蹤5精確搜索精確搜索模塊是一個提供高精度的檢索功能模塊。精確搜索接受一個或若干個確定的網(wǎng)絡入口(如網(wǎng)站的首頁),按照給定的規(guī)則,從網(wǎng)絡
4、入口開始,以深度優(yōu)先的方式對網(wǎng)絡信息節(jié)點進行遍歷,發(fā)現(xiàn)和定位敏感信息頁面和位置。精確搜索搜索結果過濾引擎網(wǎng)絡入口網(wǎng)絡入口過濾規(guī)則6網(wǎng)絡普查網(wǎng)絡普查是一個快速的信息搜索引擎。由于網(wǎng)絡信息量非常巨大,在沒有確定目標的情況之下,要尋找一個有確定特征信息的網(wǎng)絡節(jié)點并非容易的事。網(wǎng)絡普查模塊將調(diào)用商業(yè)的搜索引擎,從網(wǎng)絡上對符合確定特征的網(wǎng)絡進行一次快速篩選。迅速縮小信息的檢索范圍。通常來說,由于搜索引擎搜索結果的不確定性,網(wǎng)絡普查結果也是比較不準確的,所以對于重點對象,還需要使用精確搜索來進一步確認。網(wǎng)絡普查搜索結果搜索引擎過濾規(guī)則7專項搜索專項搜索是對精確搜索的一個擴充,專門針對網(wǎng)
5、絡中的專門內(nèi)容(如論壇,博客等)優(yōu)化的一類搜索引擎,支持對特定的內(nèi)容進行搜索,提高搜索的準確率。專項搜索搜索結果過濾引擎網(wǎng)絡論壇,博客登錄引擎過濾規(guī)則8主機探測主機探測是一個要求IP范圍,搜索有特定網(wǎng)絡服務的主機的一個搜索模塊。1.0版搜索系統(tǒng)只支持對HTTP服務的主機進行探測。主機探測模塊不需要指定檢索規(guī)則。主機探測探測結果IP過濾IP范圍服務識別9特定信息跟蹤特定信息跟蹤的主要功能是根據(jù)用戶輸入的一篇文章內(nèi)容,在用戶設定的網(wǎng)站范圍內(nèi)搜索與其有一定相似性的文章,將所得到的結果存儲在數(shù)據(jù)庫中,并可以根據(jù)用戶的要求進行更細致二次處理,從而滿足用戶跟蹤特定信息的要求。10可疑對
6、象發(fā)現(xiàn)可疑對象發(fā)現(xiàn)是在特定的網(wǎng)站查找相關作者文章,進而對該用戶的所有活動進行全面的了解,可以掌握作者的最近發(fā)帖動向。11管理引擎管理引擎是系統(tǒng)的大腦,提供一個完備的信息管理系統(tǒng),包括信息二次過濾,信息分類管理,搜索目標與規(guī)則的管理,數(shù)據(jù)備份與數(shù)據(jù)恢復,用戶身份管理和系統(tǒng)報表等功能。管理引擎還實現(xiàn)對數(shù)據(jù)庫的支持和分布式網(wǎng)格并行運算的支持,提高系統(tǒng)檢索效率,增加系統(tǒng)的適用能力。12信息分類管理和二次檢索系統(tǒng)提供一個完備的分類機制,可以按照用戶或系統(tǒng)預定的分類定義,對檢索結果進行有效分類,滿足不同場合,不同應用的需要,提高檢索信息的利用效率。系統(tǒng)提供強大的二次檢索功能,可以利用不
7、同的檢索條件,進行二次快速檢索,方便快捷地尋找到用戶需要的信息和資源。13搜索目標和搜索規(guī)則管理搜索目標是檢索的范圍,如一個特定的網(wǎng)絡,一個確定的搜索引擎等。搜索規(guī)則是檢索的過濾條件,是由一個或多個關鍵字按規(guī)定的規(guī)則組成邏輯表達式。系統(tǒng)以模板方式管理檢索搜索目標和搜索規(guī)則。用戶可以為搜索目標或規(guī)則指定不同的模板,靈活方便的增加、刪除和修改目標或規(guī)則。用戶可以為不同的應用場合和不同的時期指定不同的模板,使用檢索過程更加方便清晰。14分布式網(wǎng)格計算系統(tǒng)的分布式計算,體現(xiàn)在兩方面,一個是多任務并行檢索,一個是多服務器并行