資源描述:
《核酸定量結構功能預測》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、重慶大學碩士學位論文核酸定量結構功能預測姓名:趙巍申請學位級別:碩士專業(yè):生物學指導教師:梁桂兆20091202重慶大學碩十學位論文中文摘要摘要隨著人類基因組計劃的完成,生物學研究己進入了后基因組時代,研究重點正從積累數(shù)據(jù)向解釋數(shù)據(jù)轉變。面對急劇膨脹的基因組序列數(shù)據(jù),傳統(tǒng)的生物學方法已很難滿足需要。目前,生物信息學方法已成為核酸結構功能研究的重要手段。本文通過一種新的途徑,即以廣義堿基性質(zhì)得分(SGBP)結合自交叉協(xié)方差(ACC),線性判別分析(LDA)和支持向量機(SVM)建模,進行了DNA色譜保留指數(shù)、人類rnjI斟A、脊椎動物啟動子和人類蛋白質(zhì)
2、編碼基因預測或識別,采用自檢驗、交互驗證、外部驗證等方法驗證模型的預測能力。SvM建模所得結果如下。①DNA色譜保留預測:留一法得到的Q2鉀可達到O.851,MSE為O.1123。②miRNA預測:交互驗證J下確率(Acc)可達到77.29%。外部驗證Acc可達到75.12%。靈敏度(Sn)和特異度(Sp)分別為70.51%和82.6l%,馬修斯相關系數(shù)(MCC)為0.5160。③啟動子預測:交互驗證Acc可達到85.12%。外部驗證Acc可達到86.55%。Sn和Sp分別可以達到91.65%和81.47%,MCC為O.7336。④人類的蛋白質(zhì)編碼基
3、因預測:交互驗證Acc可達96.18%,外部驗證Acc可達97.58%,Sn和Sp分別為97.28%和97.64%,MCC為O.9141。SVM建模結果均不同程度相當或者優(yōu)于LDA建模所得結果。研究表明,SGBP.ACC組合方法能夠較好表征核酸序列特征,其含信息量大且易操作,SGBP.ACC.SVM在核酸定量結構功能預測領域具有較好的前景。關鍵詞:廣義堿基性質(zhì)得分(SGBP),支持向量機(SVM),線性判別分析(LDA)重慶人學碩士學位論文英文摘要ABSTRACTWitllmecompletionoftheh啪angenomeproject,biol
4、ogicalresearChh弱emeredmepost-genomeem.ResearchfocusisbeiI培movedfbmaccu】[Ilulationofda:tai11t0expl鋤.a(chǎn)tionofda:ta.11lebiologicmemodstmrdlytaucl(1ethewholeproblemwitlltlleexplosionofgeIloIIlicsequences.Atpresent,bioiIlf.omaticsh嬲becomeanimport趾tmethodforquantitatiVepredictionofstr
5、IJcturesand如nctionsofnucleicacids.111tllis、Ⅳork,、№deVelopedanew印pmachbycombimnganewfeaturer印resentationiIⅣolVillgscoresofgeneralizedbasepropertiescombined謝thautocmssc0V撕ance(ACC),lineardis碰millaJlta11mysis(LDA)andsupponvectormacllines(SVM)topredictchromato鏟aphicre白entiontimeofD
6、NA,a11dtoidenti矽humaIlmiRNAs,Vertebratepromoters,h啪觚exons.TheresultswereValidatedbyselfvalidation,cross—vaJidationandextemalvalidationmethods.ResultsbysVMmodelingareausfollows.①DNAchromato伊印mcretentionpredictionValidatedbyLOOCV:TlleresultsshoWedtherearethehi曲estQzcvofO.85l鋤dlo、
7、VestMSEis0.1123.②miRNAprediction:ThememodSGBP-ACC—SVMgivesallaccuracy(Acc)of77.29%byacrossvalidatioll,鋤Accof75.12%byextemalValidation,asensitiV時(Sn)of70.51%鋤daspecific時(Sp)of82.61%.Andnlemamlewscorrelationcoemcient(MCC)isO.5l60.③promoterprediction:theAccfbmaCrossvali出【tionis85.
8、12%,theAcc,Sn,SpandMCC五∞mtestsetsare86.55%,91.65%,81.4