基于密度的海量數(shù)據(jù)增量式挖掘技術(shù)研究

ID：36795628

大?。?.19 MB

頁(yè)數(shù)：60頁(yè)

時(shí)間：2019-05-15

基于密度的海量數(shù)據(jù)增量式挖掘技術(shù)研究_第1頁(yè)

基于密度的海量數(shù)據(jù)增量式挖掘技術(shù)研究_第2頁(yè)

基于密度的海量數(shù)據(jù)增量式挖掘技術(shù)研究_第3頁(yè)

基于密度的海量數(shù)據(jù)增量式挖掘技術(shù)研究_第4頁(yè)

基于密度的海量數(shù)據(jù)增量式挖掘技術(shù)研究_第5頁(yè)

資源描述：

《基于密度的海量數(shù)據(jù)增量式挖掘技術(shù)研究》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、國(guó)防科學(xué)技術(shù)人’掌研究生院學(xué)似淪文摘要增量式挖掘，就是對(duì)于大數(shù)據(jù)集(數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)等)，當(dāng)數(shù)據(jù)遞增的時(shí)候，增量地更新數(shù)據(jù)挖掘結(jié)果，而不是對(duì)每次更新后的整個(gè)數(shù)據(jù)集進(jìn)行挖掘。對(duì)r許多種類(lèi)的大型數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)挖掘，增量數(shù)掘挖掘是一個(gè)誘人的目標(biāo)。t水文主要研究了媾]i孤立點(diǎn)閃于的增量式挖掘技術(shù)。首先講述了數(shù)據(jù)挖掘的基本概念和方法，介紹了數(shù)據(jù)挖掘蜘f究的·般對(duì)象和典型心用：研究了聚類(lèi)挖掘技術(shù)，晚明了評(píng)價(jià)聚類(lèi)的一般準(zhǔn)則，簡(jiǎn)單介紹了現(xiàn)有的典型的增量挖掘力-法，為進(jìn)一步研究和學(xué)習(xí)積累了經(jīng)驗(yàn)，明確了需求。在現(xiàn)有的大多數(shù)聚類(lèi)挖掘方法中，參數(shù)的影響較大，而兒常常需要用戶指定參數(shù)，參數(shù)的決定成為實(shí)

2、際應(yīng)用的一個(gè)難點(diǎn)。本文在研究基于密度的聚類(lèi)算法的基礎(chǔ)L，提出了基于孤立點(diǎn)因子的聚類(lèi)算法，有效地解決了這個(gè)問(wèn)題：并在此基礎(chǔ)卜，提出了增量式算法，用于增量的更新聚類(lèi)結(jié)果。文中同時(shí)給出了孤立點(diǎn)因子聚類(lèi)療法的有關(guān)概念，以及相應(yīng)的算法描述，詳細(xì)說(shuō)明了算法思想和聚類(lèi)過(guò)程。最后，實(shí)驗(yàn)分析了基于孤立點(diǎn)因子的聚類(lèi)算法的有效性，并與有關(guān)算法作了性能對(duì)比，實(shí)驗(yàn)說(shuō)明了基于孤立點(diǎn)因子的聚類(lèi)算法對(duì)于參數(shù)的健壯性；實(shí)驗(yàn)也簡(jiǎn)要分析了增量式算法的有效性和效率。關(guān)鍵詞：數(shù)據(jù)挖掘聚類(lèi)分析孤立點(diǎn)因子增量更新國(guó)防科學(xué)技術(shù)大學(xué)研究生院學(xué)位論文舢孓sTRACTIncrementaldataminingisupdatingt

3、heresultofdataminingincremental1y，whendataincreaseinthelargedataset(suchasdatabaseordatahouse)，itisnotupdatingthetotaldataset．Formanykindoflargedatabasesordatahouse，incrementaldataminingisatemptablegoal．Westudytheincrementaldataminingtechnologybasedoutlierfactor．Wefirstdescribethebasicconcep

4、tsandbasicmethodandintroducethecommonlYobjectsandrepresentativeapplications：andwestudyclusteringdataminingtechnologyanddescribethecommonlyrules，andweintroducetheincrementaldatamjningmethod：soweaccumulateexperienceforfartherstudyanddefinituderequirement．Theinfluenceofthealgorithmparametersisv

5、erynotabilityandtheparametersneedtheappointofusersinmassclusteringdataminingalgorithm，sodeterminingparametersisverydifficulty．WebringforwardclusteringalgorithmbasedOUtlierfactot，andresolvetheproblemefficiency，andwegainedtheincrementalalgorithmonthebase．Wedescribetheconceptsofclusteringalgori

6、thmbasedoutiierfactor，andexplaintheideaofthealgorithmandtheclusterjngprocess．Intheend，weanalysisthevalidityofthealgorithm，andwecontrastthealgorithmwiththeether：wearialysisandvalidatethattheparametershave1ittlerjnfluencetoclusteringdataminingalgorithmbasedoutlierfactor：andwealsoanalysisandval

7、idatetheincrementalclusteringdataminingalgoritbm．KeyWords：datamining．cIustering，outIierfactor．incrementaIupdating～～———————萬(wàn)而r——————————～一獨(dú)創(chuàng)性聲明S13712本人聲明所呈交的學(xué)位論文是我本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果．盡我所知，除了文中特別加以標(biāo)注和致謝的地方外，論文中不包含其他人已經(jīng)發(fā)表和撰寫(xiě)過(guò)的研究成果，也不包含為獲得國(guó)防科學(xué)技術(shù)大學(xué)或

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 60



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無(wú)此問(wèn)題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

基于密度的海量數(shù)據(jù)增量式挖掘技術(shù)研究

基于密度的海量數(shù)據(jù)增量式挖掘技術(shù)研究

相關(guān)文章

相關(guān)標(biāo)簽