基因微陣列數(shù)據(jù)的分析算法

基因微陣列數(shù)據(jù)的分析算法

ID:32054699

大?。?.97 MB

頁(yè)數(shù):66頁(yè)

時(shí)間:2019-01-31

基因微陣列數(shù)據(jù)的分析算法_第1頁(yè)
基因微陣列數(shù)據(jù)的分析算法_第2頁(yè)
基因微陣列數(shù)據(jù)的分析算法_第3頁(yè)
基因微陣列數(shù)據(jù)的分析算法_第4頁(yè)
基因微陣列數(shù)據(jù)的分析算法_第5頁(yè)
資源描述:

《基因微陣列數(shù)據(jù)的分析算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、堆

2、大I微陣列數(shù)據(jù)的分析算法摘爨基因微陣列數(shù)據(jù)的分析算法中文摘要基因微陣列(又稱(chēng)基因芯片)可應(yīng)用對(duì)于不同發(fā)展階段,不同人體組織,不同臨床條件以及不同生物體等條件下的基因表達(dá)水平的測(cè)量?;蛐酒某霈F(xiàn)正在給生命科學(xué)研究、疾病診斷、新藥丌發(fā)、食品衛(wèi)生監(jiān)督等領(lǐng)域帶來(lái)一場(chǎng)革命。與此同時(shí),由基因微陣列技術(shù)帶來(lái)的海量數(shù)據(jù)也對(duì)傳統(tǒng)的信息處理技術(shù)帶來(lái)了很大的挑戰(zhàn)。鑒于此,本文對(duì)基因微陣列的預(yù)處理和聚類(lèi)算法進(jìn)行了研究。本文的主要貢獻(xiàn)如下:首先,提出了一種改進(jìn)的穩(wěn)健Lowcss算法,對(duì)基因微陣列的數(shù)掘進(jìn)行標(biāo)準(zhǔn)化處理。該算法首先利用局部加權(quán)線性回歸對(duì)數(shù)據(jù)點(diǎn)進(jìn)行平滑估計(jì),然后再利用核估計(jì)算法對(duì)誤差項(xiàng)進(jìn)行估計(jì),以進(jìn)一步

3、減小誤差,最后對(duì)每個(gè)格子罩的數(shù)據(jù)點(diǎn)進(jìn)行縮放處理。實(shí)驗(yàn)證明了本文算法的高效性。其次,本文提出了一種新的基因表達(dá)矩陣的缺失值估計(jì)算法。該算法首先利用迭代的K-means算法來(lái)挑選無(wú)缺失基因,再用James-Stein估計(jì)算法并結(jié)合核估計(jì)算法得出最后的估計(jì)值。實(shí)驗(yàn)證明該算法在低缺失率的時(shí)候優(yōu)于其它傳統(tǒng)估計(jì)算法。再次,本文對(duì)模糊譜雙向聚類(lèi)算法進(jìn)行了改進(jìn)。雖然模糊譜雙向聚類(lèi)算法能夠取得不錯(cuò)的效果,但是由于其使用的FCM算法對(duì)數(shù)據(jù)類(lèi)型的敏感性及其局部搜索能力,限制了它的使用,因此本文應(yīng)用GG算法和遺傳算法來(lái)改進(jìn)原算法的局限性。實(shí)驗(yàn)證明本文改進(jìn)算法的優(yōu)越性。最后,本文提出了一種基于基因和條件提取的雙向聚類(lèi)算

4、法。該算法利用央角余弦法排除那些對(duì)聚類(lèi)結(jié)果貢獻(xiàn)小的表達(dá)數(shù)據(jù),使得聚類(lèi)只在提取的基因和條件中進(jìn)行,從而降低了計(jì)算復(fù)雜度。實(shí)驗(yàn)證明本文算法優(yōu)于其它算法。關(guān)鍵詞:基因微陣列;標(biāo)準(zhǔn)化;James-Stein估計(jì);核估計(jì);雙向聚類(lèi)作者:嚴(yán)德春指導(dǎo)教師:王加俊AlgorithmsforGeneMicroarrayDataAnalysisAbstractGeneMicroarray(alsoreferredtoasGenechips)canbeusedinmeasunnggeneexpressionlevelsindifferentdevelopmentalstages,differentbodytissu

5、es,differentclinicalconditionsanddifferentorganisms,etc.Genechipsarenowbringingagreatrevolutlonmthefieldsoflifescienceresearch,diseasediagnosis,newdrugdevelopmentandfoodhygienesupervision.Meanwhile,themassiveGeneMicroarraydataalsobringg刪challengestothetraditionaltechniquesofinformationprocessing.The

6、refore,thisthesisfocusesondevelopingalgorithmsforpre-processingandbiclusteringoftheGeneMicroarraydata.Thecontributionsofthisthesisareasfollows:Firstly,鋤improvedversionoftherobustLowessnormalizationisproposedfortheno咖alizationoftheGeneMicraoarraydata.Inthisalgorithm,thedataarefirstlysmoothedwiththelo

7、callyweightedlinearregressionmethod,thentheerrorisfunher砌ucedbyestimatingtheresidueinsmoothingestimationinaframeworkofkemelestimation.finally,scalingoperationisperformedwithrespecttoeachdatap0Intonthegrid.Experimentalresultsshowbotheffectivenessandefficiencyofthisalg耐thm·Secondly'anovelstrategyfores

8、timatingthemissingdatainthegeneexpresslonm撕xispresented.ThealgorithmisbasedontheJames--Steinandkernelestlmatlonprincipleswheretheestimationmatrixisobtainedwiththek-meansalgorithm·ExperimentalresuItssh

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。