基于鄰域超圖的不完備信息系統(tǒng)分類方法研究

基于鄰域超圖的不完備信息系統(tǒng)分類方法研究

ID:35070944

大?。?.03 MB

頁(yè)數(shù):62頁(yè)

時(shí)間:2019-03-17

基于鄰域超圖的不完備信息系統(tǒng)分類方法研究_第1頁(yè)
基于鄰域超圖的不完備信息系統(tǒng)分類方法研究_第2頁(yè)
基于鄰域超圖的不完備信息系統(tǒng)分類方法研究_第3頁(yè)
基于鄰域超圖的不完備信息系統(tǒng)分類方法研究_第4頁(yè)
基于鄰域超圖的不完備信息系統(tǒng)分類方法研究_第5頁(yè)
資源描述:

《基于鄰域超圖的不完備信息系統(tǒng)分類方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、分類號(hào)TP391.4密級(jí)公開(kāi)UDC004.93學(xué)位論文編號(hào)D-10617-308-(2016)-02057重慶郵電大學(xué)碩士學(xué)位論文中文題目基于鄰域超圖的不完備信息系統(tǒng)分類方法研究英文題目AReseachforNeighborhoodHypergraphBasedClassificationAlgorithmforIncompleteInformationSystem學(xué)號(hào)S130201060姓名石瑾學(xué)位類別工學(xué)碩士學(xué)科專業(yè)計(jì)算機(jī)科學(xué)與技術(shù)指導(dǎo)教師胡峰教授完成日期2016年4月16日重慶郵電大學(xué)碩士

2、學(xué)位論文摘要摘要不完備信息系統(tǒng)的分類問(wèn)題是智能信息處理領(lǐng)域的一個(gè)研究重點(diǎn)。由于不完備信息系統(tǒng)中缺失值的存在,用傳統(tǒng)的機(jī)器學(xué)習(xí)方法直接對(duì)其進(jìn)行處理,往往效果不佳。超圖是機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)新的方法,為機(jī)器學(xué)習(xí)提供了新的解決思路。但是傳統(tǒng)的超圖在對(duì)不完備信息系統(tǒng)分類時(shí)主要有以下三個(gè)問(wèn)題:(1)傳統(tǒng)超圖不能處理離散型數(shù)據(jù);(2)傳統(tǒng)的超圖模型在訓(xùn)練過(guò)程中的超邊替換環(huán)節(jié)具有很大的隨機(jī)性;(3)不完備信息系統(tǒng)中缺失值的存在使傳統(tǒng)超圖不適用。為解決上述問(wèn)題我們提出了解決方案并通過(guò)實(shí)驗(yàn)驗(yàn)證了解決方案的有效性。本

3、文的創(chuàng)新點(diǎn)在于:(1)提出基于不完備信息系統(tǒng)的鄰域超圖。將鄰域粗糙集理論與超圖模型結(jié)合的鄰域超圖解決了傳統(tǒng)超圖不能處理離散型屬性的問(wèn)題。但由于不完備信息系統(tǒng)中缺失值的存在使得普通的鄰域超圖仍不適用。于是本文結(jié)合不完備信息系統(tǒng)的聯(lián)系度提出了基于不完備信息系統(tǒng)的鄰域超圖,并通過(guò)鄰域超圖演化學(xué)習(xí)的過(guò)程最終得到一個(gè)效果較好的分類器。(2)在鄰域超圖演化學(xué)習(xí)過(guò)程中加入粗糙集的指導(dǎo)。粗糙集可以不依賴先驗(yàn)知識(shí),根據(jù)數(shù)據(jù)的決策與分布進(jìn)行知識(shí)發(fā)現(xiàn),一旦使用這種能力,就可以在鄰域超圖迭代訓(xùn)練過(guò)程進(jìn)行有監(jiān)督的指導(dǎo),提

4、高超圖中超邊的泛化能力。(3)結(jié)合Spark,將本文提出的算法并行化。本文提出的第一個(gè)算法在大數(shù)據(jù)集的運(yùn)行時(shí)間久,效率較低。所以我們結(jié)合Spark提出了基于鄰域超圖對(duì)不完備系統(tǒng)分類的并行化算法。Spark的特性使得其在并行化有多次迭代的機(jī)器學(xué)習(xí)算法時(shí)有其它并行化框架沒(méi)有的優(yōu)勢(shì),于是我們通過(guò)并行化超圖的演化訓(xùn)練階段,降低了算法的時(shí)間復(fù)雜度,從而有效的改善了本文提出的算法在大數(shù)據(jù)集上的執(zhí)行效率。對(duì)于基于鄰域超圖的不完備系統(tǒng)分類算法,本文在15個(gè)UCI數(shù)據(jù)集上進(jìn)行了仿真實(shí)驗(yàn),并與粗糙集分類算法、C4.

5、5、SVM、NavieBayes等方法進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明,文中算法在Precision、Recall、AUC、F-measure等多個(gè)指標(biāo)上,具有較好的效果。此外,本文還通過(guò)實(shí)驗(yàn)驗(yàn)證了并行化后的算法不僅能保持原算法的有效性,而且能大幅度降低算法執(zhí)行時(shí)間。關(guān)鍵詞:鄰域粗糙集超圖不完備信息系統(tǒng)分類并行化SparkI重慶郵電大學(xué)碩士學(xué)位論文AbstractAbstractTheclassificationproblemofincompleteinformationsystemisahotissue

6、inintelligentinformationprocessing.Duetotheexistenceofmissingvalueinincompleteinformationsystem,itisineffectivebyusingtraditionalmachinelearningmethodtodealwith.Inordertoprovetheaccuracyofincompleteinformationsystem,manysolutionshavebeenproposedfromd

7、ifferentperspective.(1)Turntheincompleteinformationsystemintoacompleteinformationsystem,thenclassifythesystembyusingthemethodwhichisusedforcompleteinformationsystem.(2)Classifytheincompleteinformationsystemdirectly.Amongthesedifferentdataanalysistheo

8、riesandmethods,roughsetsarethemostfrequentlyused.Therearesomeextensionmodelsinroughsettodealwithincompleteinformationsystem,suchastolerancerelation,limitedtolerancerelation,non-symmetricsimilarityrelation,etc.Hypergraphisanewintelligentmethodformachi

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。