基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析

基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析

ID:33091197

大?。?.92 MB

頁(yè)數(shù):52頁(yè)

時(shí)間:2019-02-20

基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析_第1頁(yè)
基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析_第2頁(yè)
基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析_第3頁(yè)
基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析_第4頁(yè)
基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析_第5頁(yè)
資源描述:

《基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)

1、中山大學(xué)碩士學(xué)位論文基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析姓名:王明霞申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):信息計(jì)算科學(xué)指導(dǎo)教師:戴道清20100529摘要論文題目專業(yè)碩士生指導(dǎo)教師基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析信息計(jì)算科學(xué)王明霞戴道清教授隨著時(shí)代的進(jìn)步,基因功能研究逐漸超越基因序列研究,成為后基因組時(shí)代研究的重點(diǎn):并且微陣列技術(shù)使研究人員可以同時(shí)測(cè)定成千上萬(wàn)個(gè)基兇的表達(dá)水平,這為生物標(biāo)志物的檢測(cè)以及癌癥診斷提供了重要的技術(shù)支持。然而基因表達(dá)數(shù)據(jù)的高維數(shù)、高噪聲的特點(diǎn)對(duì)分析方法提出了更高的要求.如何在海量基因表達(dá)數(shù)據(jù)中,發(fā)現(xiàn)腫瘤組織的基因表達(dá)模式,并成功地將臨床表征不明或容易誤診的惡性腫瘤

2、準(zhǔn)確、快速地區(qū)分開(kāi),是一項(xiàng)具有挑戰(zhàn)性的研究課題。近年來(lái),多種判別分析和變量選擇的方法用于基因表達(dá)數(shù)據(jù)的分析。于是生物標(biāo)志物的檢測(cè)一從成千上萬(wàn)個(gè)基因當(dāng)中檢測(cè)出那些與腫瘤起因、發(fā)展緊密相關(guān)的關(guān)鍵基因的方法逐漸增加,這使得癌癥的診斷更準(zhǔn)確且更容易解釋。本文圍繞運(yùn)用局部敏感半監(jiān)督特征選擇方法和稀疏懲罰實(shí)現(xiàn)變量選擇方法,及其在基于基因表達(dá)數(shù)據(jù)進(jìn)行生物標(biāo)志物檢測(cè)以及癌癥診斷的應(yīng)用而展開(kāi).本文受到局部敏感半監(jiān)督特征選擇、局部敏感判別分析以及稀疏PCA的啟發(fā),將局部敏感和稀疏方法結(jié)合起來(lái)提出一種新的判別方法一稀疏局部敏感法則。這樣,一方面利用局部敏感算法的優(yōu)勢(shì),即在處理小樣本問(wèn)題時(shí),能夠提取更多

3、局部的結(jié)構(gòu)信息而不單單是全局的判別信息,最終使得同類樣本足夠接近,不同類樣本盡量分離,以便取得良好的癌癥分類效果:另一方面,利用彈性網(wǎng)的解的稀疏性,使得提取的最佳分類特征儀僅是少數(shù)原始變最的線性組合,這種方法應(yīng)用在基于基因表達(dá)數(shù)據(jù)分析中,具有很好的生物解釋意義,為尋找致病基因提供重要依據(jù)。摘要關(guān)鍵詞:稀疏,局部敏感,特征提取,癌癥分類,致病基因?qū)ふ尧騎itleMajorNameSupervisor●:Microarraydataanalysisbasedonlocalitysensitivecri-terionw_imsparsity:InformationandComputat

4、ionalSciense:Ming-XiaWang:ProfessorDao-QingDaiABSTRACTWiththeprogressofTheTimes,thecoleofthebiologicalresearchischangingfromgenesequencetogenefunction.ThecDNAmicroarraytechnologymakesitpossibletosimultaneouslymeasuretheexpressionlevelofgenes.Thist3E℃h—nologyspurstheresearchonbiomarkeridentifi

5、cationandcancerclassificationusinggeneexpressiondata.However,howtoeffectiveexploittheusefulinfor-mationfromtheseunprecedentedamountofmicroarraydatabycomputationalmethodsisanopenandchallengingissue.Inrecentyears,variousdiscriminantanalysisandvariableselectionmethodshavebeenusedforanalysisingge

6、neexpressiondata.Somoleandmolebiomarkeridentificationswhichidentitybasegenesbeencriticaltotumorarecoming.Thismakesiteasytodiagnoseandexplain.Ourmethodisbasedonlocalitysensitivesemi-supervisedfeatureselectionandsparsenessandusingthisforbiomarkeridentificationanddiagnosisofcan-cel:Afterlearning

7、thefollowingmethods:Localitysensitivesemi-supervisedfeatureselection,Localitysensitivediscrimin礬tanalysisandSparsePCA,weproposeanovelfeatureselection-Microarraydataanalysisbasedonlocalitysensitivecriterionwithsparsity,whichcombineLocalitysens

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。