資源描述:
《基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、中山大學(xué)碩士學(xué)位論文基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析姓名:王明霞申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):信息計(jì)算科學(xué)指導(dǎo)教師:戴道清20100529摘要論文題目專業(yè)碩士生指導(dǎo)教師基于稀疏局部敏感法則的微陣列數(shù)據(jù)分析信息計(jì)算科學(xué)王明霞戴道清教授隨著時(shí)代的進(jìn)步,基因功能研究逐漸超越基因序列研究,成為后基因組時(shí)代研究的重點(diǎn):并且微陣列技術(shù)使研究人員可以同時(shí)測(cè)定成千上萬(wàn)個(gè)基兇的表達(dá)水平,這為生物標(biāo)志物的檢測(cè)以及癌癥診斷提供了重要的技術(shù)支持。然而基因表達(dá)數(shù)據(jù)的高維數(shù)、高噪聲的特點(diǎn)對(duì)分析方法提出了更高的要求.如何在海量基因表達(dá)數(shù)據(jù)中,發(fā)現(xiàn)腫瘤組織的基因表達(dá)模式,并成功地將臨床表征不明或容易誤診的惡性腫瘤
2、準(zhǔn)確、快速地區(qū)分開(kāi),是一項(xiàng)具有挑戰(zhàn)性的研究課題。近年來(lái),多種判別分析和變量選擇的方法用于基因表達(dá)數(shù)據(jù)的分析。于是生物標(biāo)志物的檢測(cè)一從成千上萬(wàn)個(gè)基因當(dāng)中檢測(cè)出那些與腫瘤起因、發(fā)展緊密相關(guān)的關(guān)鍵基因的方法逐漸增加,這使得癌癥的診斷更準(zhǔn)確且更容易解釋。本文圍繞運(yùn)用局部敏感半監(jiān)督特征選擇方法和稀疏懲罰實(shí)現(xiàn)變量選擇方法,及其在基于基因表達(dá)數(shù)據(jù)進(jìn)行生物標(biāo)志物檢測(cè)以及癌癥診斷的應(yīng)用而展開(kāi).本文受到局部敏感半監(jiān)督特征選擇、局部敏感判別分析以及稀疏PCA的啟發(fā),將局部敏感和稀疏方法結(jié)合起來(lái)提出一種新的判別方法一稀疏局部敏感法則。這樣,一方面利用局部敏感算法的優(yōu)勢(shì),即在處理小樣本問(wèn)題時(shí),能夠提取更多
3、局部的結(jié)構(gòu)信息而不單單是全局的判別信息,最終使得同類樣本足夠接近,不同類樣本盡量分離,以便取得良好的癌癥分類效果:另一方面,利用彈性網(wǎng)的解的稀疏性,使得提取的最佳分類特征儀僅是少數(shù)原始變最的線性組合,這種方法應(yīng)用在基于基因表達(dá)數(shù)據(jù)分析中,具有很好的生物解釋意義,為尋找致病基因提供重要依據(jù)。摘要關(guān)鍵詞:稀疏,局部敏感,特征提取,癌癥分類,致病基因?qū)ふ尧騎itleMajorNameSupervisor●:Microarraydataanalysisbasedonlocalitysensitivecri-terionw_imsparsity:InformationandComputat
4、ionalSciense:Ming-XiaWang:ProfessorDao-QingDaiABSTRACTWiththeprogressofTheTimes,thecoleofthebiologicalresearchischangingfromgenesequencetogenefunction.ThecDNAmicroarraytechnologymakesitpossibletosimultaneouslymeasuretheexpressionlevelofgenes.Thist3E℃h—nologyspurstheresearchonbiomarkeridentifi
5、cationandcancerclassificationusinggeneexpressiondata.However,howtoeffectiveexploittheusefulinfor-mationfromtheseunprecedentedamountofmicroarraydatabycomputationalmethodsisanopenandchallengingissue.Inrecentyears,variousdiscriminantanalysisandvariableselectionmethodshavebeenusedforanalysisingge
6、neexpressiondata.Somoleandmolebiomarkeridentificationswhichidentitybasegenesbeencriticaltotumorarecoming.Thismakesiteasytodiagnoseandexplain.Ourmethodisbasedonlocalitysensitivesemi-supervisedfeatureselectionandsparsenessandusingthisforbiomarkeridentificationanddiagnosisofcan-cel:Afterlearning
7、thefollowingmethods:Localitysensitivesemi-supervisedfeatureselection,Localitysensitivediscrimin礬tanalysisandSparsePCA,weproposeanovelfeatureselection-Microarraydataanalysisbasedonlocalitysensitivecriterionwithsparsity,whichcombineLocalitysens