資源描述:
《文獻挖掘在豬繁殖性狀候選基因分析中的應(yīng)用研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、上海交通大學博士學位論文文獻挖掘在豬繁殖性狀候選基因分析中的應(yīng)用研究姓名:張向喆申請學位級別:博士專業(yè):@指導教師:潘玉春201003摘要文獻挖掘在豬繁殖性狀候選基因分析中的應(yīng)用研究文獻挖掘是一種能夠從文獻中抽取、整合并發(fā)現(xiàn)知識的高效工具,而且它能夠快速處理大量文獻并獲得某一特定領(lǐng)域的知識信息。生物醫(yī)學文獻數(shù)據(jù)庫因涵蓋了生命科學的絕大部分領(lǐng)域,所包含的文獻數(shù)量巨大,而成為全世界生物信息挖掘的一大源泉。繁殖性能是影響?zhàn)B豬業(yè)的重要經(jīng)濟性狀之一,然而豬的基因組測序還沒有全部完成,已確定的對豬繁殖性狀有影響的基因不多。大多數(shù)研究者通過查閱人及模式生物小鼠、大鼠等的生殖相關(guān)文獻來確定候選基因進而采
2、用候選基因法進行相關(guān)研究。然而面對海量的生殖相關(guān)研究文獻,單個研究者不可能全部閱讀,更不可能完全掌握所有的基因及其之間的關(guān)系。因此,我們從比較基因組學的角度,以人類生殖相關(guān)基因作為豬繁殖相關(guān)的候選基因,運用生物自然語言處理技術(shù)和Swanson理論對MEDLINE數(shù)據(jù)庫中的數(shù)據(jù)進行文獻挖掘,構(gòu)建了ReCGiP數(shù)據(jù)庫,同時為了檢驗該數(shù)據(jù)庫的有效性,以所獲得的個別重要基因為例,對其進行分子進化和功能分化分析及實驗驗證。具體研究內(nèi)容及結(jié)果如下:1.豬繁殖性狀候選基因的文獻挖掘通過文獻挖掘獲得了以精子形成、卵子形成、受精、胚胎著床前發(fā)育、胚胎著床和胎盤發(fā)育六個生殖主要過程為主題的一系列可作為影響豬
3、繁殖性狀候選基因的主題相關(guān)基因,并針對這六個主題分別構(gòu)建了基因同現(xiàn)網(wǎng)絡(luò),整合了相關(guān)的文獻、GO注釋和KEGG通路等信息,構(gòu)建了豬繁殖性狀候選基因數(shù)據(jù)庫(DatabaseofRe,),用戶可以.通____p過rodu網(wǎng)etio址nCandidateGenesinBigsbasedonbibliomiesReCOiPhttp://klab.sjtu.edu.cn/ReCGiP/對ReCGiP數(shù)據(jù)庫進行訪問。ReCGiP數(shù)據(jù)庫還包括經(jīng)自然語言處理和人工篩查的與繁殖過程和繁殖性狀(如產(chǎn)仔數(shù)、出生活仔數(shù)和乳頭數(shù)等)相關(guān)的豬的基因和文獻信息。2.HIF-a基因家族的分子進化選擇和功能分化分析依據(jù)Re
4、CGiP數(shù)據(jù)庫,對所獲得的六個主題的相關(guān)基因進行生物通路富集分析,發(fā)現(xiàn)血管內(nèi)皮生長因子(VEGF)信號通路是諸多通路中的一個富集通路,該通路在生殖過程中有重要作用。同時,我們發(fā)現(xiàn)基因VEGFA是精子形成、卵子形成、受精、著床和胎盤發(fā)育5個生殖主要過程中的重要基因,而缺氧誘導因子la(HIFlA)是胎盤發(fā)育過程中的重要基因。VEGFA是血管生成中最主要的血管新生調(diào)節(jié)因子,對血管的生成和滲透能力有重要作用,是誘導著床和早期妊娠血管變化的重要基因。而缺氧誘導因子a家族是一轉(zhuǎn)錄調(diào)控因子家族,該家族成員對VEGFA有調(diào)控作用。因此,我們認為VEGFA和HIF-a基因家族成員可能是影響豬繁殖性狀的重
5、要基因。有鑒于此,我們首先采用三種假設(shè)條件不同的模型對脊椎動物HIF-a基因家族的DNA序列數(shù)據(jù)進行分析,估計分子替代率、確定選擇壓力。同時應(yīng)用TreeSAAP程序和DIVERGE程序算法研究影響HIF-a基因家族進化的選擇壓力、預(yù)測重要的選擇位點。結(jié)果表明,基因復(fù)制是HIF-a基因家族三個成員形成的原因。而且通過對氨基上海交通大學博士學位論文酸理化性質(zhì)變化評估和采用最大似然法檢測發(fā)現(xiàn)對HIF-a基因家族進化起主要作用的是純化選擇。此外,HIF-a基因家族成員兩兩成對比較表明該基因家族發(fā)生系統(tǒng)分化后可變的功能約束發(fā)生在一些特殊的氨基酸位點。這些發(fā)現(xiàn)可以為進一步的實驗驗證提供參考。3.HI
6、F-a基因家族和FEGFA基因多態(tài)性與豬繁殖性狀的相關(guān)研究在對HIF-a基因家族的分子進化選擇和功能分化分析的基礎(chǔ)上,我們運用直接測序法在豬中尋找基因HIFIA、EPASl、HIF3A和VEGFA的多態(tài)位點,同時采用PCR-RFLP方法進行多態(tài)位點的檢測及分子標記與性狀的關(guān)聯(lián)分析研究,獲得4個基因的片段長度分別為4245bp,4010bp,802bp和2562bp。使用生物信息學方法和輻射雜種克隆板將基因HIFIA定位于豬l號染色體長臂,具體核苷酸序列位置是199605043bp~199827355bp;基因EPASl定位于豬3號染色體長臂11.14區(qū),具體核苷酸序列位置是8750210
7、3bp,--87601420bp。在基因VEGFA的擴增片段中共檢測到17個多態(tài)位點,其中有4個位點可以進行PCR.RFLP檢測。在梅山豬保種群和法系大白豬群體中對VEGFA基因的4個多態(tài)位點進行基因型頻率及等位基因頻率分析,結(jié)果表明:VEGFA基因的BstH2l、Ec032I、PspEI三個多態(tài)位點在梅山豬中A等位基因占優(yōu)勢,BcnI多態(tài)位點在梅山豬中B等位基因占優(yōu)勢,而在法系大白豬中VEGFA基因的BstH2I和PspEI多態(tài)位