資源描述:
《分子進(jìn)化與系統(tǒng)發(fā)育分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、系統(tǒng)發(fā)育學(xué)研究的是進(jìn)化關(guān)系,系統(tǒng)發(fā)育分析就根據(jù)同源性狀的分歧來(lái)推斷或者評(píng)估這些進(jìn)化關(guān)系。通過(guò)系統(tǒng)發(fā)育分析所推斷出來(lái)的進(jìn)化關(guān)系一般用分枝圖(進(jìn)化樹(shù))來(lái)描述,這個(gè)進(jìn)化樹(shù)描述了分子(基因樹(shù))、物種以及二者之間遺傳關(guān)系的譜系。由于“Glade”這個(gè)詞(擁有共同祖先的同一譜系)在西臘文中的本意是分支,所以系統(tǒng)發(fā)育學(xué)有時(shí)被稱為遺傳分類(lèi)學(xué)(cladistics)。在現(xiàn)代系統(tǒng)發(fā)育研究中,重點(diǎn)己不再是生物的形態(tài)學(xué)特征或其他特征,而是生物大分子尤其是序列,對(duì)序列的系統(tǒng)發(fā)育分析又稱為分子系統(tǒng)學(xué)或分子系統(tǒng)發(fā)育研究。它的發(fā)展得益于大量序列的測(cè)定和分析程序的完善。比起許多其他實(shí)驗(yàn)性學(xué)科,分子系統(tǒng)學(xué)與其他進(jìn)化研究一樣
2、有其局限,即系統(tǒng)發(fā)育的發(fā)生過(guò)程都是己經(jīng)完成的歷史,只能在擁有大量序列信息的基礎(chǔ)上去推斷過(guò)去曾經(jīng)發(fā)生過(guò)什么,而不能再現(xiàn)。由于系統(tǒng)發(fā)育分析不太可能擁有實(shí)驗(yàn)基礎(chǔ),至多是些模擬實(shí)驗(yàn)或者病毒實(shí)驗(yàn):如何處理序列從中得到有用信息、如何用計(jì)算的辦法得到可信的系統(tǒng)樹(shù)、如何從有限的數(shù)據(jù)得到進(jìn)化模式成為這個(gè)領(lǐng)域的研究熱點(diǎn)。1進(jìn)化樹(shù)構(gòu)建構(gòu)建進(jìn)化樹(shù)的方法包括兩種:一類(lèi)是基于序列類(lèi)似性比較,主要是基于氨基酸/核酸相對(duì)突變率矩陣計(jì)算不同序列差異性積分作為它們的差異性量度而構(gòu)建的進(jìn)化樹(shù);另一類(lèi)是在難以通過(guò)序列比較構(gòu)建進(jìn)化樹(shù)的情況下,通過(guò)蛋白質(zhì)結(jié)構(gòu)比較包括剛體結(jié)構(gòu)疊合和多結(jié)構(gòu)特征比較等方法建立的進(jìn)化樹(shù)。2評(píng)估進(jìn)化樹(shù)和數(shù)據(jù)
3、現(xiàn)在己經(jīng)有一些程序可以用來(lái)評(píng)估數(shù)據(jù)中的系統(tǒng)發(fā)育信號(hào)和進(jìn)化樹(shù)的健壯性。對(duì)于前者,最流行的方法是用數(shù)據(jù)信號(hào)和隨機(jī)數(shù)據(jù)作對(duì)比實(shí)驗(yàn)(偏斜和排列實(shí)驗(yàn)):對(duì)于后者,可以對(duì)觀察到的數(shù)據(jù)重新取樣,進(jìn)行進(jìn)化樹(shù)的支持實(shí)驗(yàn)(非參數(shù)自引導(dǎo)和對(duì)折方法)。似然比例實(shí)驗(yàn)可以對(duì)取代模型和進(jìn)化樹(shù)都進(jìn)行評(píng)估。本文只闡述幾個(gè)常用的方法:偏斜實(shí)驗(yàn)(SkewnessTest):統(tǒng)計(jì)的臨界值隨著分類(lèi)群數(shù)口的不同和序列中點(diǎn)的不同而不同,對(duì)隨機(jī)數(shù)據(jù)集呈現(xiàn)的信號(hào)很敏感,可以用來(lái)決定系統(tǒng)發(fā)育信號(hào)是否保留著。排列實(shí)驗(yàn)(PTP,permutationtailprobability):對(duì)MP樹(shù)的分值和那些通過(guò)對(duì)每一個(gè)位點(diǎn)都進(jìn)行大量排列組合而得到
4、的數(shù)據(jù)所推算出來(lái)的進(jìn)化樹(shù)的分值進(jìn)行比較,從而決定在原始數(shù)據(jù)中是否存在系統(tǒng)發(fā)育信號(hào)。自引導(dǎo)評(píng)估(bootstrap):Bootstrap是由Felsenstein(1985)引入分子分類(lèi)領(lǐng)域的,現(xiàn)己成為分析分子樹(shù)置信區(qū)間最常用的方法。其原理是假定某序列Ao有N個(gè)位點(diǎn),Bootstrap復(fù)制時(shí)從Ao中隨機(jī)取N個(gè)位點(diǎn)。Ao中的某些位點(diǎn)可能被隨機(jī)遺漏,而某些位點(diǎn)則可能取到不僅一次,由此組成一個(gè)新序列A1。對(duì)一組數(shù)據(jù)復(fù)制n次,則可得到Ao衍生的n組數(shù)據(jù)。由此可構(gòu)建n個(gè)分子樹(shù),根據(jù)“多數(shù)規(guī)則”(majorityrule)從這n個(gè)分子樹(shù)中統(tǒng)計(jì)得到一致樹(shù)(consensustree),一致樹(shù)中各分支結(jié)構(gòu)
5、在n個(gè)分子樹(shù)中出現(xiàn)的比率便表示原始數(shù)據(jù)對(duì)該結(jié)構(gòu)的支持率。可以對(duì)任何建樹(shù)方法進(jìn)行評(píng)估。模擬研究表明,在合適的條件下也就是各種替換速率基本相等,樹(shù)枝基本對(duì)稱的條件下,如果自引導(dǎo)數(shù)值大于70,那么所得的系統(tǒng)發(fā)育進(jìn)化樹(shù)能夠反映真實(shí)的系統(tǒng)發(fā)生史的可能性要大于95%。3線性樹(shù)(LinearizedTree)在進(jìn)化中,雖然核酸或氨基酸的替代絕不會(huì)是嚴(yán)格恒定的,但是在估計(jì)序列間分歧時(shí)間方面,分子鐘依然有用。當(dāng)今我們對(duì)物種間的分歧時(shí)間或基因重復(fù)事件發(fā)生的時(shí)間仍知之甚少,因此為了理解進(jìn)化過(guò)程,即便粗略地估計(jì)分歧時(shí)間也是十分重要的。排除比平均速率顯著慢或快的譜系,并對(duì)剩余的譜系按分子鐘假說(shuō)構(gòu)建進(jìn)化樹(shù),就有可能
6、估計(jì)不同譜系對(duì)間或不同序列對(duì)間粗略的分歧時(shí)間。按此途徑構(gòu)建的樹(shù)稱為線性樹(shù)。線性樹(shù)始終遵循分子鐘假說(shuō)。線性樹(shù)的構(gòu)建分如下幾個(gè)步驟:(1)用無(wú)需速率恒定假說(shuō)的構(gòu)樹(shù)法對(duì)一組序列構(gòu)建可靠的樹(shù),并用外類(lèi)群序列定出樹(shù)根。(2)對(duì)所用序列檢驗(yàn)速率恒定假說(shuō),并刪除與平均速率有顯著偏差的序列。(3)用速率恒定假說(shuō)對(duì)剩余的序列重建一棵系統(tǒng)樹(shù)。(4)如果己知某一序列對(duì)的分歧時(shí)間和序列分歧度,則能標(biāo)定進(jìn)化時(shí)間。進(jìn)化樹(shù)的構(gòu)建方法1建立數(shù)據(jù)模型建立一個(gè)比對(duì)模型的基本步驟包括:選擇合適的比對(duì)程序,然后從比對(duì)結(jié)果中提取系統(tǒng)發(fā)育的數(shù)據(jù)集,至于如何提取有效數(shù)據(jù),取決于所選擇的建樹(shù)程序如何處理容易引起歧義的比對(duì)區(qū)域和插入/刪
7、除序列(即所謂的空位狀態(tài))。一個(gè)典型的比對(duì)過(guò)程包括:首先應(yīng)用CLUSTALW程序及類(lèi)似程序,進(jìn)行多序列比對(duì),最后提交給一個(gè)建樹(shù)程序。這個(gè)過(guò)程有如下特征選項(xiàng):①部分依賴于計(jì)算機(jī);②需要一個(gè)先驗(yàn)的系統(tǒng)發(fā)育標(biāo)準(zhǔn)(即需要一個(gè)前導(dǎo)樹(shù));③使用先驗(yàn)評(píng)估方法和動(dòng)態(tài)評(píng)估方法對(duì)比對(duì)參數(shù)進(jìn)行評(píng)估;④對(duì)基本結(jié)構(gòu)(序列)進(jìn)行比對(duì);⑤應(yīng)用非統(tǒng)計(jì)數(shù)學(xué)優(yōu)化。這些特征選項(xiàng)的取舍依賴于系統(tǒng)發(fā)育分析方法。2決定替代模型替代模型既影響比對(duì),也影響建樹(shù)。因此需要采用遞歸方