資源描述:
《基因組與比較基因組學(xué)研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第九講基因組與比較基因組學(xué)研究一、人工染色體構(gòu)建二、新的測序策略--全基因組鳥槍法測序三、全基因組序列分析--基因組學(xué)的新內(nèi)容四、比較基因組學(xué)(Comparativegenomics)一、人工染色體構(gòu)建1983年,美國的Dana-Farber癌癥研究所和哈佛大學(xué)醫(yī)學(xué)院的教授首次在Nature上發(fā)表文章,報道了構(gòu)建YAC(YeastArtificialChromosome)庫的過程。1987年,Burke等人發(fā)現(xiàn),僅僅帶有ARS序列的載體雖然能夠被復(fù)制,但極易在有絲分裂時丟失。即使在選擇培養(yǎng)基上,也只有5%-20%的子代細(xì)胞帶有ARS載體。加入
2、Centromeres(CEN)能顯著提高ARS質(zhì)粒在有絲分裂時的穩(wěn)定性,90%以上子代細(xì)胞帶有該載體。CEN還能顯著降低拷貝數(shù),從20-50/細(xì)胞降為1-2/細(xì)胞。(Science,236:806-812)。人工染色體含有三種必需成分:著絲粒、端粒和復(fù)制起點。著絲粒(CEN)位于染色體中央,呈紐扣狀結(jié)構(gòu),在有絲分裂時結(jié)合微管并調(diào)控染色體的運動,也是姐妹染色單體配對時的最后位點,接收細(xì)胞信號而使姐妹染色體分開。端粒(TEL):主要功能是防止染色體融合、降解、確保其完整復(fù)制。端粒酶以其自身RNA為模板,在染色體端部添加上端粒重復(fù)序列,并參與端粒
3、長度和細(xì)胞增殖的調(diào)控。復(fù)制起點:DNA復(fù)制通常由起始蛋白與特定的DNA序列相互作用開始。DNA合成的起始位點和DNA復(fù)制起點(遺傳位點)所需的Cis靶區(qū)常位于同一段長約100bp的DNA上。YAC的主要缺點1.存在高比例的嵌合體,即一個YAC克隆含有兩個本來不相連的獨立片段;2.部分克隆子不穩(wěn)定,在轉(zhuǎn)代培養(yǎng)中可能會發(fā)生缺失或重排;3.難與酵母染色體區(qū)分開,因為YAC與酵母染色體具有相似的結(jié)構(gòu)。4.操作時容易發(fā)生染色體機械切割。以細(xì)菌寄主系統(tǒng)為基礎(chǔ)的克隆載體形成嵌合體的頻率較低,轉(zhuǎn)化效率高,又易于分離。科學(xué)家用"染色體建造"法用F質(zhì)粒及其調(diào)控基
4、因構(gòu)建細(xì)菌載體,克隆大片段DNA。該質(zhì)粒主要包括oriS,repE(控制F質(zhì)粒復(fù)制)和parA、parB(控制拷貝數(shù))等成分。BAC的優(yōu)點1.易于用電擊法轉(zhuǎn)化E.coli(轉(zhuǎn)化效率比轉(zhuǎn)化酵母高10-100倍);2.超螺旋環(huán)狀載體,易于操作;3.F'質(zhì)粒本身所帶的基因控制了質(zhì)粒的復(fù)制;4.很少發(fā)生體內(nèi)重排。?有人把人類染色體端粒DNA上單個α-衛(wèi)星DNA單元多聚化形成1Mb左右的大片段并與人類基因組DNA混合,產(chǎn)生了能被復(fù)制、能正常分裂并得到長期穩(wěn)定保存的人工合成的染色體,長度約為6-10Mb,稱為MAC或HAC。二、新的測序策略--全基因
5、組鳥槍法測序?qū)δ郴蚪M文庫全部克隆片段進行末端序列測定中未測到的堿基數(shù),即缺口(gap),與已測定的總堿基數(shù)相關(guān)。隨著已測定堿基數(shù)的增加,缺口的總堿基數(shù)目會按照泊松公式的一個推論(P=e-m)迅速減小。其中P為基因組中某個堿基未被測定的概率,m為所測定的堿基數(shù)與基因組大小相比的倍數(shù)。m越大P值越小。當(dāng)m值達(dá)到5(即隨機測定的堿基數(shù)達(dá)到基因組5倍時),基因組中未測定的堿基數(shù)為基因組總堿基數(shù)的0.67%(e-5=0.0067)。對流感嗜血桿菌這樣大的基因組(1.83Mb),可能留有128個平均長度為100bp的缺口。全基因組鳥槍法測序的主要步驟是
6、:第一,建立高度隨機、插入片段大小為2kb左右的基因組文庫。克隆數(shù)要達(dá)到一定數(shù)量,即經(jīng)末端測序的克隆片段的堿基總數(shù)應(yīng)達(dá)到基因組5倍以上。第二,高效、大規(guī)模的末端測序。對文庫中每一個克隆,進行兩端測序,TIGR在完成流感嗜血桿菌的基因組時,使用了14臺測序儀,用三個月時間完成了必需的28,463個測序反應(yīng),測序總長度達(dá)6倍基因組。第三,序列集合。TIGR發(fā)展了新的軟件,修改了序列集合規(guī)則以最大限度地排除錯誤的連鎖匹配。第四,填補缺口。有兩種待填補的缺口,一是沒有相應(yīng)模板DNA的物理缺口,二是有模板DNA但未測序的序列缺口。他們建立了插入片段為1
7、5-20kb的λ文庫以備缺口填補。鳥槍法測序的缺點隨著所測基因組總量增大,所需測序的片段大量增加,各個片段重疊或一個連續(xù)體的概率是2n2-2n高等真核生物(如人類)基因組中有大量重復(fù)序列,導(dǎo)致判斷失誤。對鳥槍法的改進(1)Clonecontig法。首先用稀有內(nèi)切酶把待測基因組降解為數(shù)百kb以上的片段,再分別測序。(2)靶標(biāo)鳥槍法(diretedshotgun)。首先根據(jù)染色體上已知基因和標(biāo)記的位置來確定部分DNA片段的相對位置,再逐步縮小各片段之間的缺口。SSLPs,simplesequencelengthpolymorphisms;STR
8、s,simpletandemrepeats;SNPs,singlenucleotidepolymorphisms.LINEs,longinterspersednuc