資源描述:
《DNA序列數(shù)值映射方法的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、生物醫(yī)學(xué)工程學(xué)雜志JBiomedEng2005;22(4)∶681~685*DNA序列數(shù)值映射方法的研究饒妮妮邱麗君(電子科技大學(xué)生命科學(xué)與技術(shù)學(xué)院,成都610054)摘要DNA序列的數(shù)值映射是用數(shù)學(xué)方法、物理方法和數(shù)字信號處理方法分析生物分子序列首先要解決的問題。本文分析了現(xiàn)有8種DNA序列數(shù)值映射方法的特點和適應(yīng)性。在此基礎(chǔ)上,提出了一種基于DNA序列中堿基出現(xiàn)概率的數(shù)值映射方法。大多數(shù)蛋白編碼序列具有3-堿基周期特性(周期-3性質(zhì))。借助于具有周期-3性質(zhì)的DNA序列的頻譜分析,比較了8種數(shù)值映射方法的優(yōu)劣,并證實了新方法的有效性。計算機(jī)仿真結(jié)果表明,基于復(fù)域的映
2、射方法無論從攜帶原有生物分子序列的信息量,還是數(shù)值映射后所得功率譜的效果均優(yōu)于其它7種映射方法,而DNA序列新數(shù)值映射方法能夠獲得與復(fù)域法幾乎相同的識別率。關(guān)鍵詞DNA序列數(shù)值映射3-堿基周期性頻譜分析StudyofNumericalMappingMethodsforDNASequencesRaoNiniQiuLijun(SchoolofLifeScience&Technology,UniversityofElectronicScienceandTechnologyofChina,Chengdu610054,China)AbstractThefirstproblemto
3、besolvedistomapDNAsequencesontonumericalsequencesinbio-molecularsequenceanalysisbymathematical,physicalanddigitalsignalprocessingmethods.Thecharactersandtheadaptabilityofeightexistingmappingmethodsareanalyzedinthispaper.AnewnumericalmappingmethodbasedontheprobabilityofbasesinthesegmentDN
4、Asequenceispresented.Mostofthecodingsequencesarecharacterizedby3-baseperiodicity.Furthermore,eightnumericalmappingmethodsarecomparedandthenewmethodisverifiedbymeansofthespectrumanalysisofDNAsequencewith3-baseperiodicity.Thecomputersimulationresultsshowthatthemappingmethodbasedcomplexplan
5、eissuperiortotheothersevenmethodsinreflectingtheoriginalinformationofthebio-molecularsequenceandthequalityoftheobtainedpowerspectra.Theidentificationratethenewmethodattainsisapproximatelywhatthecomplexplanemethodhasachieved.KeywordsDNAsequenceNumericalmapping3-baseperiodicitySpectrumanal
6、ysis[4,5]可行的方法。本文首先將現(xiàn)有8種映射方法按照1引言其自身特點分為3類,再對具有周期-3性質(zhì)的[6]在用數(shù)學(xué)方法、物理方法和數(shù)字信號處理方法DNA序列進(jìn)行數(shù)值映射后進(jìn)行傅立葉變換,依據(jù)-1對DNA序列進(jìn)行分析的研究中,首先需要把組成1/3bp頻率點上譜峰的高低以及正確識別出周期-DNA序列的四種堿基(A、C、T、G)按照一定的規(guī)3性質(zhì)的識別率高低,對8種映射方法進(jìn)行了比較。則映射成相應(yīng)的數(shù)值序列。有關(guān)研究表明,DNA序現(xiàn)有的8種映射方法均假設(shè)了DNA序列中的四個列數(shù)值映射方法的優(yōu)劣會直接影響到最終分析結(jié)果堿基等概率出現(xiàn),這與部分DNA序列的情況不符,[1,
7、2]的生物學(xué)意義的解釋。隨著基因數(shù)據(jù)庫的不斷豐無疑,將會損失或掩蓋這部分生物分子序列所攜帶[7]富,對大量序列的進(jìn)一步研究證實,編碼蛋白質(zhì)的序的有用生物信息。因此,本文提出一種能夠反映原列具有周期-3性質(zhì),而非編碼序列(如內(nèi)含子等)不序列中堿基出現(xiàn)概率(即堿基在序列中的含量),同具有此性質(zhì)。盡管已有研究表明,少量較短的編碼序時又能繼承基于復(fù)域映射方法優(yōu)點的映射方法--概[3]列并不具有周期-3性質(zhì),但利用這一性質(zhì)來識別率法,通過計算機(jī)仿真實驗,得到了較高識別率,DNA序列中的蛋白質(zhì)編碼序列或基因仍然是一種證實了新映射方法的有效性。*教育部