資源描述:
《基因微陣列數據的雙向聚類算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、蘇州大學碩士學位論文基因微陣列數據的雙向聚類算法研究姓名:張瑾申請學位級別:碩士專業(yè):通信與信息系統(tǒng)指導教師:王加俊20080501基因微陣列數據的雙向聚類算法研究摘要基因芯片是由大量DNA或寡核苷酸探針密集排列所形成的探針陣列?;蛐酒咸结樑c經熒光標記的目標樣品進行生物反應,利用專用芯片檢測系統(tǒng)并借助于一定的軟件即可得到基因表達數據。這個技術應用于不同發(fā)展階段,不同人體組織,不同臨床條件以及不同生物體等條件下的基因表達水平的測量?;蛐酒某霈F正在給生命科學研究’、疾病診斷、新藥開發(fā)、食品衛(wèi)生監(jiān)
2、督等領域帶來二場革命。本文的貢獻主要體現在以下幾個方面:首先,對基因數據分析中的一種雙向聚類方法—格子模型法進行了深入的分析,并對其進行了改進。格子模型是一個混合有二進制變量和連續(xù)變量的模型。對于該模型,傳統(tǒng)的用于連續(xù)變量的優(yōu)化算法不再適用。為此,本文提出了一種新穎的神經網絡方法來解決這種混合有二進制變量和連續(xù)變量的優(yōu)化問題,并將該方法應用于酵母數據分析,實驗結果表明使用這種方法后雙聚類的精度得到了很大的提高。其次,本文還對基因數據分析的另一種方法非負矩陣分解方法進行了改進。傳統(tǒng)的非負矩陣分解算法有
3、一定缺陷,其初始值是隨機設定的,因此在迭代過程中會出現微小的抖動。為此本文在迭代計算過程中加入了數據平滑處理,并將該方法用于一組白血病微陣列數據分析。實驗結果表明,改進過的非負矩陣分解算法提高了分類的準確率,同時這個方法避免了NMF算法的“零值”問題。第三,本文介紹了NNMF算法的基本原理,對其加入了一個平滑處理,增加了數據元素之間的聯系,同時這個方法由于抬高了數據,避免了NMF算法中的“零值”問題。本文首次將NNMF算法應用于生物信息學中,用白血病微陣列數據進行了實驗。實驗結果表明,該方法提高了分
4、類的準確率及算法的收斂速度。關鍵詞:基因數據分析,雙向聚類,格子模型.,神經網絡,非負矩陣因子分解,數據平滑處理作者:張瑾指導老師:王加俊一StudiesoiltheBiclu壁!生豎壘墮2生些里!魚!魚!呈!堅壟翌竺型里竺苧.一一壘;墮翌!!竺!—————————————————————————_—_——_———————————————————————————————一一一一ABSTRACTGenechipsarehighdensityprobearrayscomposedoflargeamoun
5、tofDNAoroligonucleotideprobes.Theprobesonthechiphybridizewiththefluorescentlymarkedtargetsamples.Thegeneexpressiondatacanbeobtainedbyusingthespecialchipsdetectionsystemsandwiththehelpofsomesoftware.Theapplicationsofsuchatechnologyareinmeasuringgeneexpr
6、essionlevelsindifferentdevelopmentalstages,differentbodytissues,differentclinicalconditionsanddifferentorganisms,etc.Genechipsarenowbringingagreatrevolutioninthefieldsoflifescienceresearch,diseasediagnosis,newdrugdevelopmentandfoodhygienesupervision.Th
7、econtributionsofthisthesisareasfollows:Firstly,anovelneural.networkapproachisproposedfortheplaidmodelwhereboththebinaryandcontinuousvariablesarecontainedandthetraditionallyusedoptimizationmethodsforproblemswithonlycontinuousvariables.cannotbeemployedfo
8、rit.Thismethodwasappliedtotheyeastdata.Experimentalresultsshowthattheaccuracyofthebiclusteringcallbesignificantlyimprovedwiththeproposedalgorithm.Secondly,animprovednon-negativematrixfactorization(NMF)algorithmwasproposed.Inourimproveda