資源描述:
《分子進(jìn)化基礎(chǔ)(i)序列置換模型》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、分子進(jìn)化基礎(chǔ)(I)序列置換模型CharlesDarwin(1809–1882)存于CambridgeUniversityLibrary結(jié)婚的好處與壞處I不結(jié)婚的好處與壞處1838年結(jié)論:結(jié)婚,結(jié)婚,結(jié)婚!中性進(jìn)化學(xué)說創(chuàng)立者M(jìn)otooKimura木村資生(1924-1994)Nature1968,217:624-626Kimura(1983)TheNeutralTheoryofMolecularEvolution.8個(gè)蛋白質(zhì)的進(jìn)化速率按Kimura分子鐘計(jì)算,一個(gè)長度為100aa的蛋白質(zhì)平均每28x106年出現(xiàn)一次變化“Asfarasi
2、sknown,synonymousmutationsaretrulyneutralwithrespecttonaturalselection.”King&Jukes,1969.Non-DarwinianEvolution.Science,164:788-798.deleteriousadvantagesdeleteriousneutralKimura(1968)Nature217624-626Kimura假設(shè)大多數(shù)的置換是中性的,或者說很小一部分變化是由于達(dá)爾文進(jìn)化引起的中性突變(等位基因)與野生型具有相同的適合度分子進(jìn)化的中性突變理
3、論在分子水平,大多數(shù)進(jìn)化的變化和同一個(gè)物種中的大多數(shù)變異不是由于選擇造成的,而是由與自然選擇等價(jià)的基因隨機(jī)漂變造成的。Graur&Li.FundamentalsofMolecularEvolution用分子信息研究進(jìn)化問題DNA僅由四個(gè)堿基組成DNA進(jìn)化的規(guī)律性基因組信息速率和時(shí)間估計(jì)DNA序列突變祖先基因XYt+1t時(shí)間X’Y’DNA序列進(jìn)化AAGACTTTGGACTTAAGGCCT-3milyrs-2milyrs-1milyrstodayAGGGCATTAGCCCTAGCACTTAAGGCCTTGGACTTTAGCCCATAGAC
4、TTAGCGCTTAGCACAAAGGGCATAGGGCATTAGCCCTAGCACTTAAGACTTTGGACTTAAGGCCTAGGGCATTAGCCCTAGCACTTAAGGCCTTGGACTTAGCGCTTAGCACAATAGACTTTAGCCCAAGGGCAT序列差異(距離)?DNA序列間的平均置換數(shù)對于兩條長度為n的序列,統(tǒng)計(jì)差異數(shù)目nd;p=nd/n為兩條序列之間的距離(差異)在序列的同一個(gè)位點(diǎn)可能發(fā)生不止一次的變化。如在一條序列的第10個(gè)位置觀測到A,而在另一條序列為T,有多種可能A?TA?C?T…DNA置換模型的必要
5、性必須準(zhǔn)確和無偏見地估計(jì)分歧度和速率數(shù)學(xué)模型可以考慮回復(fù)和平行突變等情況,尤其是在p值較大時(shí)Jukes-Cantor單參數(shù)模型最簡單的DNA序列進(jìn)化模型假設(shè)任一位點(diǎn)的核苷酸置換概率相同,僅有一個(gè)參數(shù),即一個(gè)核苷酸變?yōu)榱硪粋€(gè)核苷酸的概率為?;一個(gè)核苷酸變?yōu)槠渌魏我粋€(gè)核苷酸的概率為3?ACGT嘌呤嘧啶??????一個(gè)單位時(shí)間后:A演變?yōu)?種其他任何一種核苷酸的概率為γ=3?A保持不變的概率為A=1-3?查楊子恒書以qt表示兩個(gè)序列間相同核苷酸的比率,pt表示不相同的比率,pt=1-qt;在時(shí)間t+1,兩個(gè)物種間相同核苷酸的比率qt+1,
6、可由以下兩個(gè)獨(dú)立事件組成的:X和Y相同位點(diǎn)保持不變的概率為(1-3?)×(1-3?)X和Y不同的位點(diǎn),變?yōu)橄嗤母怕剩篨i的核苷酸變?yōu)閅i對應(yīng)的核苷酸的概率,而Yi保持不變:?×(1-3?)反之依然:?×(1-3?)qt+1=[(1-3?)×(1-3?)+?×(1-3?)×2]×ptKimura雙參數(shù)模型兩類核苷酸嘌呤:A,G嘧啶:C,T轉(zhuǎn)換(Transitions):相似置換顛換(Transversions):嘌呤被嘧啶置換,反之亦然在實(shí)際數(shù)據(jù)中,轉(zhuǎn)換置換的速率常高于顛換的速率ACGT嘌呤嘧啶??????轉(zhuǎn)換=?顛換=?核苷酸置換模
7、型Jukes–Cantor單參數(shù)模型Kimura雙參數(shù)模型Equal-input模型Tamura模型HKY模型…...休息一下……序列分歧較小時(shí),兩個(gè)模型的結(jié)果基本相同序列分歧較大時(shí),雙參數(shù)模型更為準(zhǔn)確(尤其是當(dāng)轉(zhuǎn)換概率明顯高于顛換概率時(shí))單參數(shù)和雙參數(shù)模型的比較一般模型的問題所有位點(diǎn)的置換速率并不是一致的一些位點(diǎn)的進(jìn)化并不是獨(dú)立的,如相互作用位點(diǎn)可能需要互補(bǔ)突變(例:發(fā)卡結(jié)構(gòu))計(jì)算軟件例子:MEGA2.1考慮序列間隔的情況在序列的同源區(qū)對位排列時(shí),常常插入間隔(-表示)來表示插入或缺失(indel)。這些間隔增加了距離估計(jì)的復(fù)雜度。
8、當(dāng)然,也可能是由于實(shí)驗(yàn)的原因,出現(xiàn)喪失信息的位點(diǎn)(?表示)。在距離估計(jì)中,一般忽略這類位點(diǎn),可用兩種不同的方法處理完全刪除成對刪除320seq1A-AC-GGAT-AGGA-ATAAAseq2AT-CC?GATAA?GA