《基于數(shù)據(jù)挖掘的局域網(wǎng)絡(luò)用戶行為分類的研究》

《基于數(shù)據(jù)挖掘的局域網(wǎng)絡(luò)用戶行為分類的研究》

ID:37016144

大小:222.51 KB

頁數(shù):8頁

時間:2019-05-13

《基于數(shù)據(jù)挖掘的局域網(wǎng)絡(luò)用戶行為分類的研究》_第1頁
《基于數(shù)據(jù)挖掘的局域網(wǎng)絡(luò)用戶行為分類的研究》_第2頁
《基于數(shù)據(jù)挖掘的局域網(wǎng)絡(luò)用戶行為分類的研究》_第3頁
《基于數(shù)據(jù)挖掘的局域網(wǎng)絡(luò)用戶行為分類的研究》_第4頁
《基于數(shù)據(jù)挖掘的局域網(wǎng)絡(luò)用戶行為分類的研究》_第5頁
資源描述:

《《基于數(shù)據(jù)挖掘的局域網(wǎng)絡(luò)用戶行為分類的研究》》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、基于數(shù)據(jù)挖掘的局域網(wǎng)絡(luò)用戶行為分類的研究席卓,何剛**510(北京郵電大學(xué)信息與通信工程學(xué)院,北京100876)摘要:利用數(shù)據(jù)挖掘的技術(shù),對局域網(wǎng)絡(luò)用戶的用戶行為進(jìn)行深層發(fā)掘。本文使用從局域網(wǎng)絡(luò)綜合管理系統(tǒng)提取的用戶行為原始數(shù)據(jù),將數(shù)據(jù)進(jìn)行相關(guān)處理后,針對數(shù)據(jù)的結(jié)構(gòu)和內(nèi)有特點,依據(jù)Leader-follower、K-means算法自己編程實現(xiàn)了對數(shù)據(jù)進(jìn)行聚類分析,從海量數(shù)據(jù)中深入發(fā)掘有價值的信息。根據(jù)對局域網(wǎng)內(nèi)用戶在上班、下班時段頁面瀏覽次數(shù)的聚類分析結(jié)果,對用戶行為進(jìn)行分析與分類,得出一定時間段內(nèi)用戶行為規(guī)律,并

2、依據(jù)該聚類結(jié)果對異常網(wǎng)絡(luò)行為進(jìn)行識別。結(jié)果表明:該聚類方法能很好的對用戶行為進(jìn)行分類,達(dá)到了預(yù)期。關(guān)鍵詞:數(shù)據(jù)挖掘;用戶行為分類;局域網(wǎng);Leader-follower;K-means中圖分類號:TP393.115ResearchofLANuserbehaviousclassificationbasedondataminingXIZhuo,HEgang(SchoolofInformationandCommunicationEngineering,BeijinguniversityofPostsand2025303540

3、Telecommunications,Beijing100876)Abstract:Basedonthedataminingtheory,thethesismakesadeepresearchonLANuserbehaviousclassification.ByusingthedatacollectingfromLANmanagementsystem,theauthorrealizedtheLeader-follower,K-meansalgorithmsandexploreedvaluableinformation

4、.Then,thethesisanalysesclustedresultofnumberofLANusers'viewingwebpageandgetsomeregularpatternsforthenetworkbehavious.Theresearchshowsthattheclusteranalysisisaapplicablemethodfornetworkuserbehaviousclassification.Keywords:Dataminig;Userbahaviousclassification;LAN

5、;Leader-follower;K-means0引言近年來,隨著網(wǎng)絡(luò)的普及和網(wǎng)絡(luò)應(yīng)用的層出不窮,互聯(lián)網(wǎng)已經(jīng)成為人們獲取知識,社會交流的平臺,而且其重要性也越來越重要。而以企事業(yè)單位、學(xué)?;蛞粋€機(jī)構(gòu)為單位的局域網(wǎng),在其中扮演著十分重要的角色。局域網(wǎng)能夠提供穩(wěn)定,高帶寬的網(wǎng)絡(luò)環(huán)境,便于同一局域網(wǎng)內(nèi)的用戶使用,但是它的弊端也隨著越來越多的應(yīng)用而出現(xiàn)。例如,一個公司使用一個局域網(wǎng),但是無法確定那些員工在上班時間在工作還是從事與工作無關(guān)的網(wǎng)絡(luò)行為,如瀏覽網(wǎng)頁,大量收發(fā)郵件或網(wǎng)絡(luò)發(fā)帖。在一些情況下,與工作無關(guān)的行為,如BT下載,

6、在線音樂或在線視頻點播不僅影響員工的工作效率,而且有時還會占用大量的正常帶寬,破壞的網(wǎng)絡(luò)環(huán)境,對正常工作的員工造成很大的影響。所以,研究一個局域網(wǎng)內(nèi)大量用戶的網(wǎng)絡(luò)行為,并使用數(shù)據(jù)挖掘技術(shù)對某些類似的行為歸為同類,將差異很大的行為視為不同類,能夠有效的達(dá)到對不同的網(wǎng)絡(luò)行為進(jìn)行區(qū)分的目的。依據(jù)對某特定局域網(wǎng)內(nèi)用戶行為的分類結(jié)果,網(wǎng)絡(luò)管理員能夠清晰的了解到當(dāng)前網(wǎng)絡(luò)用戶的網(wǎng)絡(luò)使用情況,做到精確定位,差別化指定網(wǎng)絡(luò)使用策略,提高網(wǎng)絡(luò)的使用效率和環(huán)境。作者簡介:席卓,(1985-),男,主要研究方向:寬帶IP。通信聯(lián)系人:何剛,(

7、1971-),男,副教授,主要研究方向:寬帶IP網(wǎng)絡(luò).E-mail:brianhe@bupt.edu.cn-1-1數(shù)據(jù)挖掘技術(shù)簡介1.1數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘(DataMining)是指從大量的、不完全的、有噪聲的、模糊地、隨機(jī)的數(shù)據(jù)45505560中,提取隱含在其中的、人們不知道的、但又擁有潛在有用信息和知識的過程。這些知識一般可表示為概念(Concepts)、規(guī)則(Rules)、規(guī)律(Regularities)和模式(Patterns)等。它是一門交叉性學(xué)科,涉及到機(jī)器學(xué)習(xí)、模式識別、歸納推理、統(tǒng)計學(xué)、數(shù)據(jù)庫、

8、數(shù)據(jù)可視化和高性能計算等多個領(lǐng)域。因為數(shù)據(jù)挖掘涉及的學(xué)科領(lǐng)域和方法很多,有多種分類方法。根據(jù)挖掘任務(wù),可分為分類或預(yù)測模型發(fā)現(xiàn)、數(shù)據(jù)總結(jié)、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴關(guān)系或依賴模型發(fā)現(xiàn)、異常和趨勢發(fā)現(xiàn)等[1]。1.2數(shù)據(jù)挖掘的功能數(shù)據(jù)挖掘是一個利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過程,這些模型和關(guān)系可以用來

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。