基于組件的高維數(shù)據(jù)降維方法研究.pdf

基于組件的高維數(shù)據(jù)降維方法研究.pdf

ID:52353862

大小:241.03 KB

頁(yè)數(shù):3頁(yè)

時(shí)間:2020-03-26

基于組件的高維數(shù)據(jù)降維方法研究.pdf_第1頁(yè)
基于組件的高維數(shù)據(jù)降維方法研究.pdf_第2頁(yè)
基于組件的高維數(shù)據(jù)降維方法研究.pdf_第3頁(yè)
資源描述:

《基于組件的高維數(shù)據(jù)降維方法研究.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。

1、l經(jīng)驗(yàn)交玩學(xué)術(shù)探討}.一==一=一一:.-:一一一一一一:一-}2012率l(J朝l基于組件的高維數(shù)據(jù)降維方法研究王素芳(廣東白云學(xué)院,廣東廣州510430)[摘要]為了有效處理高維數(shù)據(jù),提出將高維數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)及算法封裝在Web服務(wù)組件內(nèi),并使用c#語(yǔ)言設(shè)計(jì)和實(shí)現(xiàn)了高維數(shù)據(jù)組件模型。[關(guān)鍵詞]高維數(shù)據(jù);降維;Web服務(wù);組件設(shè),以及未考慮數(shù)據(jù)序列相關(guān)性等局限性,為此相繼提出了1.引言動(dòng)態(tài)PCA、非線性PCA、多塊PCA和多尺度PCA等多種改隨著科學(xué)技術(shù)的發(fā)展以及互聯(lián)網(wǎng)的興起,人們大量使用進(jìn)型PCA算法,其中核主分量分

2、析KPCA,是通過(guò)核函數(shù)引現(xiàn)代技術(shù)手段和方法從事科學(xué)研究和技術(shù)開發(fā)。這些技術(shù)和入非線性變換,將輸入特征映射到核Mercer特征空間,再進(jìn)方法所獲取的數(shù)據(jù)大多是高維數(shù)據(jù),高維數(shù)據(jù)的統(tǒng)計(jì)分析變一步作PCA處理。得越來(lái)越普遍,也愈來(lái)愈重要。但由于“維災(zāi)”的影響,也使得2.2局部線性嵌入方法高維數(shù)據(jù)處理變得異常地困難,必須采用一些特殊的手段進(jìn)局部線性嵌入算法(LLE),是針對(duì)非線性數(shù)據(jù)的一種降行處理。高維數(shù)據(jù)的處理問(wèn)題可以歸結(jié)為通過(guò)相關(guān)的降維方維方法,能夠使降維后的數(shù)據(jù)保持原有的拓?fù)浣Y(jié)構(gòu),LLE廣法減少一些不太相關(guān)的數(shù)據(jù)而降低

3、它的維數(shù),然后用低維數(shù)泛應(yīng)用在圖像數(shù)據(jù)的分類與聚類,以及生物和化學(xué)信息處理?yè)?jù)的處理辦法進(jìn)行處理。高維數(shù)據(jù)成功處理的關(guān)鍵在于降維等領(lǐng)域中。LLE算法解決了從高維空間通過(guò)降維映射獲取低方法的選擇。維非線性流形的問(wèn)題。以后人們又相繼提出了LLE的泛化算如何有效地分析處理大量的高維數(shù)據(jù)信息,用簡(jiǎn)便可行法、有監(jiān)督模式的局部線性嵌入算法SLLE等。的方法從原始數(shù)據(jù)中提取有用信息,進(jìn)而用可靠的數(shù)學(xué)模型2.3非線性映照方法來(lái)描述、推測(cè)觀測(cè)數(shù)據(jù),是當(dāng)前研究的熱點(diǎn)?!珎€(gè)可行的辦法非線性映照方法是將高維空間的點(diǎn)集映照N-維空間,是把高維數(shù)據(jù)

4、對(duì)象設(shè)計(jì)成“組件”,在組件內(nèi)部封裝高維數(shù)據(jù)在映照中盡量保持各點(diǎn)間的距離結(jié)構(gòu)不變。非線性映照方法的基本信息,對(duì)外隱蔽其復(fù)雜的處理邏輯,使高維數(shù)據(jù)用戶在冶金、化學(xué)領(lǐng)域的研究中有很多成功的實(shí)例,化工專家將能通過(guò)簡(jiǎn)單“接口”與之交互。這種基于組件的方法不同于傳非線性映照方法等用于生產(chǎn)過(guò)程最優(yōu)化控制,發(fā)明了模式識(shí)統(tǒng)處理模式。它有利于簡(jiǎn)化高維數(shù)據(jù)的使用以及實(shí)現(xiàn)多種算別調(diào)優(yōu)技術(shù),產(chǎn)生了極大的社會(huì)和經(jīng)濟(jì)效益。法集成,為研究和解決高維數(shù)據(jù)問(wèn)題提供了~個(gè)新途徑。本2.4投影尋蹤方法文研究的主要內(nèi)容是介紹幾種主要降維方法,將多種有效的投影尋

5、蹤fPP1是針對(duì)非正態(tài)、非線性數(shù)據(jù)分析需要而產(chǎn)高維數(shù)據(jù)“降維’,算法封裝成WebServices組件。生的一種探索性方法,是一種穩(wěn)健的降維統(tǒng)計(jì)方法。PP的分2.高維數(shù)據(jù)降維方法析途徑是“審視數(shù)據(jù)——模擬過(guò)程——檢驗(yàn)效果”。投影尋蹤在高維數(shù)據(jù)研究領(lǐng)域,“降維”一直是一個(gè)熱點(diǎn)。其中,主技術(shù)不需要事先把多維數(shù)據(jù)人工整理為知識(shí),構(gòu)造成數(shù)據(jù)庫(kù)要的“降維”算法有:PCA、MDS和LLE,前兩種屬于線性降進(jìn)行訓(xùn)練后再進(jìn)行推理,而是直接對(duì)多維數(shù)據(jù)進(jìn)行降維,對(duì)維方法,后者屬于非線性降維方法,相比之下LLE有更多應(yīng)數(shù)據(jù)做客觀投影診斷,并自

6、動(dòng)尋找反映高維空間規(guī)律的數(shù)據(jù)用實(shí)例。其它算法有:PP,它是處理非正態(tài)數(shù)據(jù)的一種新興的結(jié)構(gòu)。統(tǒng)計(jì)方法;EM——是針對(duì)稀疏的、高維二元數(shù)據(jù)的快速聚類2.5小波分析方法算法;ICA——是針對(duì)非高斯分布數(shù)據(jù)的一種線性變換方法。高維數(shù)據(jù)樣本中通常包含大量異常數(shù)據(jù),一般須先剔除此外,主成份分析、非線性映照、線性判別函數(shù)等統(tǒng)計(jì)學(xué)方法這些異常數(shù)據(jù),但在各數(shù)據(jù)項(xiàng)之間關(guān)系未知的情況下,檢測(cè)也有較多的應(yīng)用。異常樣本比較困難,為此,人們提出了一種基于小波分析的2.1主成分分析方法異常數(shù)據(jù)樣本檢測(cè)方法。小波分析能檢測(cè)到信號(hào)的高頻變化主成分分析(

7、PCA)是常用的高維數(shù)據(jù)降維方法。PCA的及其發(fā)生時(shí)間(位置),因此被廣泛應(yīng)用于信號(hào)處理領(lǐng)域的數(shù)原理是對(duì)原特征空間進(jìn)行去二階相關(guān)和降維處理,構(gòu)造出一據(jù)分析問(wèn)題。但由于小波分析對(duì)多自變量數(shù)據(jù)進(jìn)行處理相當(dāng)個(gè)低維子空間,將待識(shí)別的對(duì)象投影到低維獨(dú)立子空間中去困難,因此通常將小波分析與其它方法結(jié)合起來(lái),例如,利用進(jìn)行識(shí)別。但由于傳統(tǒng)PCA存在著諸如高斯假設(shè)、線性假PCA和非線性映照方法先進(jìn)行降維,然后利用小波分析的局作者簡(jiǎn)介:王素芳,女,江西吉安人,碩士,講師。研究方向:數(shù)據(jù)庫(kù),人工智能,多媒體技術(shù)等。一71—學(xué)術(shù)探討經(jīng)驗(yàn)交琉

8、21tl2簿第∽目部分析優(yōu)勢(shì)檢測(cè)出異常數(shù)據(jù)。最后再結(jié)合其它降維算法作進(jìn)PublicHMDataKPcatHMDataObject(){_.??一步處理。[System.web.Services.WebMethod]“降維”一直是高維數(shù)據(jù)研究領(lǐng)域的一個(gè)熱點(diǎn),對(duì)于不同PublicHMDataLeeHMDataObject(){???·

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。