基于層次提取—局部聚類社區(qū)挖掘算法的研究

基于層次提取—局部聚類社區(qū)挖掘算法的研究

ID:33383612

大?。?.54 MB

頁數(shù):61頁

時間:2019-02-25

基于層次提取—局部聚類社區(qū)挖掘算法的研究_第1頁
基于層次提取—局部聚類社區(qū)挖掘算法的研究_第2頁
基于層次提取—局部聚類社區(qū)挖掘算法的研究_第3頁
基于層次提取—局部聚類社區(qū)挖掘算法的研究_第4頁
基于層次提取—局部聚類社區(qū)挖掘算法的研究_第5頁
資源描述:

《基于層次提取—局部聚類社區(qū)挖掘算法的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、基于層次提?。植烤垲惖纳鐓^(qū)挖掘算法摘要社會網(wǎng)絡(luò)是指社會個體成員之間因為互動而形成的相對穩(wěn)定的關(guān)系體系,其中聯(lián)系較為緊密的團體稱為社區(qū),處在同一社區(qū)中的個體更易于受到社區(qū)內(nèi)其他人的影響,而社區(qū)挖掘技術(shù)就是挖掘網(wǎng)絡(luò)中存在的社區(qū)。然而大多數(shù)社區(qū)挖掘算法都是面向中小型網(wǎng)絡(luò),當(dāng)處理結(jié)點數(shù)千萬級甚至上億級的網(wǎng)絡(luò)時,耗費巨大時間和資源,因而無法應(yīng)用。針對大型社會網(wǎng)絡(luò)社區(qū)結(jié)點和邊數(shù)量巨大、社區(qū)結(jié)構(gòu)復(fù)雜,普通社區(qū)挖掘算法挖掘效率低的問題,本文提出層次提?。植烤垲惖纳鐓^(qū)挖掘算法。首先提出局部聚類算法,即提取社區(qū)中某一結(jié)點度較高的結(jié)點為核心結(jié)點及某一鄰接結(jié)點,分

2、別對兩結(jié)點提取所有的鄰接結(jié)點,通過對這些結(jié)點中公共結(jié)點數(shù)量來判斷這兩個結(jié)點是否屬于同一社區(qū),通過該方法依次以社區(qū)內(nèi)其他未被訪問結(jié)點為核心結(jié)點再進行判定,直至社區(qū)內(nèi)不存在未被訪問結(jié)點,重復(fù)該過程直至社區(qū)劃分完全;然后在該算法的基礎(chǔ)上進行改進,提出多層擴展及無環(huán)結(jié)點移除的改進思想,并通過實驗分析驗證可行性;最后將該算法應(yīng)用在大型社會網(wǎng)絡(luò)的社區(qū)挖掘中,對大型的社會網(wǎng)絡(luò)核心結(jié)點提取,采用層次提取的方法,減少了算法結(jié)點掃描次數(shù),并通過實驗對算法的可行性進行了驗證。實驗結(jié)果表明該算法能有效的實現(xiàn)社區(qū)劃分,并且有著較低的時間復(fù)雜度和較高的劃分精度,并且可以通

3、過對閾值的調(diào)整,自由控制挖掘社區(qū)的大小及質(zhì)量。關(guān)鍵詞:社會網(wǎng)絡(luò);社區(qū)挖掘;層次提??;局部聚類;無環(huán)節(jié)點;哈爾濱工程大學(xué)碩士學(xué)位論文AbstractAsocialnetworkisasocialstructuremadeupofindiViduals,andc01mectedwi[heachotherbyoneormorespeciflctypesofinterdependency,suchasfriendship,Commoni【lterest,w01.kingrelationorkinship.Inanetwork,thosecloselyl

4、inkedgroupcalledtheCom:nunity,andcommunit)7miningalgorithmsareusedtominingthepotentialcommunities.H(1weVer,mostc()mmunityminingalgorithmsaredesignedformediumnetworks,a11dcannotd(:a1withthoselarge-sca】esocialnetworks.Thispapel-proposedanSNAalgorithmthatextractionnodesbyaVerag

5、enodedegreeandclustertheneighbornodestoanalyzealarge—scalesocialnetworks.Firstly,wepropos‘:dlocalcorenodeexpa【nsionalgorimm,Ⅵ,hichextractsanodewithhighnodedegreeandoneofitsneighbors,gettheentirefirstnoorneighbornodes,thendiVideorcombinethepairsbythepercentageofsharednodes,by

6、thismethod,analyseallunVisitednodesinthecorrmunityuntilethec01nmunityisdivided.Secondly,basedonthisalgoritm,wep】oposedmulti.extensionidentifyandacyclicnodesremoVedide0109ical,thenmaderelatiVeexperiments.nnally,weapplythealgorithminlarge—scaleSNAcommunityminjngandverifiedthef

7、easibilityofthealgorithmthrou曲experiments.Basedonalotexperiment,aUtheresultshowsthisalgorithmisworked,andhaVealowertimecomplexityandahigherclassificationaccuracycomparedwithoth(。rSNAcommunit),miningalgorithm,moreoVer,thisSNSalgorithmcanfreecontrolthesizeofminedcommurlitiesby

8、changethet11reshold.Keywords:Large.scaleSocialNetworks;SNAalgorithm;cluster

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。