資源描述:
《人類群體遺傳結(jié)構(gòu)的圖論主坐標分析方法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、人類群體遺傳結(jié)構(gòu)的圖論主坐標分析方法 某人群中某位點上各等位基因的頻率,即是該群體在該位點上的遺傳結(jié)構(gòu);其全部位點上的基因頻率即是該人群的整個遺傳結(jié)構(gòu)。人群遺傳結(jié)構(gòu)的差異,實質(zhì)上是基因頻率的差異。人類群體遺傳變異性水平受人口遷移、人群融合、自然選擇、漂變、地理和社會隔離、突變等多因素的綜合影響,這些因素的綜合作用構(gòu)成了群體內(nèi)或群體間某位點或多位點的遺傳結(jié)構(gòu)。遺傳結(jié)構(gòu)數(shù)據(jù)可用基因頻率矩陣表示。由于群體內(nèi)或群體間廣泛存在基因多態(tài)性現(xiàn)象,一個位點常常包括多個等位基因,多個位點所包含的等位基因數(shù)目和組合方式則更是復(fù)雜多樣。如果僅用某位點中的一
2、個等位基因分析其群體遺傳結(jié)構(gòu),不能充分利用其遺傳變異信息,結(jié)論是片面的,故須對每個基因分別進行分析。但是,利用不同基因所作的分析其結(jié)論往往不同,難以統(tǒng)一。傳統(tǒng)的解決方法之一是對基因頻率矩陣進行主坐標分析,將各群體的主坐標作為新的綜合指標,再以散點圖的形式映射到二維或三維空間中,從而幫助研究者從整體上分析人類群體遺傳結(jié)構(gòu)的基本規(guī)律。因而,在群體遺傳學(xué)研究中被廣泛應(yīng)用但是,盡管主坐標分析能在二維或三維空間中顯示各群體的遺傳結(jié)構(gòu),卻不能揭示各群體之間的內(nèi)在關(guān)系。本研究認為, 將圖論方法與主坐標分析有機結(jié)合,利用圖論方法構(gòu)建各群體的最小生
3、成樹(minimalspanning中心化基因頻率矩陣中的元素為數(shù)值變量資料,tree,MST),并把最小生成樹整合到主坐標散點圖可選擇歐氏(Euclidean)距離、馬氏(Manhattan)距上,即可進一步揭示主坐標散點圖中各群體之間離、曼哈頓(Block區(qū)組)距離、Bray-Curtis距離或的內(nèi)在遺傳結(jié)構(gòu)關(guān)系,稱之為圖論主坐標分析Kulczynski距離等不相似性測度構(gòu)建群體(dK)間(graphtheoryprinc;palcoordinatesanaiysis)<dcRibli的n>n階不相似性矩陣;③將不相似性
4、測度進行0.5dK轉(zhuǎn)化,該轉(zhuǎn)換可保證在計算過程中保持原有的不相似性;④對轉(zhuǎn)換后的矩陣進行譜分解獲得特征根L及其對應(yīng)的特征向量U,并進一步計算各主坐標的貢獻率及其累計貢獻率;⑤根據(jù)Y=-u計算主坐標值,取前1、主坐標繪制二維主坐標散點圖?! ?.2.2按圖論原理求過m維空間n個點的最小生成樹 ⑴圖論與最小生成樹的基本概念圖論是近年來較活躍的數(shù)學(xué)分支之一,其研究對象為圖。圖[7]是指某類具體事物的頂點(vertex,或節(jié)點note)以及它們間的聯(lián)系(圖1)。節(jié)點與節(jié)點之間用線段聯(lián)系,稱為邊(edge,或支路branch);某邊的端點稱為與
5、該邊的關(guān)聯(lián)(incident),與同一邊關(guān)聯(lián)的兩個端點稱為鄰接(adjacant);起點與終點重合的通路為回路(circuit)。若圖中兩端點間由一條通路連接,則兩端點是聯(lián)通的(connected),該圖稱為聯(lián)通圖;不含有回路的連通圖稱為“對”,樹中的邊稱為樹枝??梢宰C明樹中任兩頂點間必有一條且僅有一條通路。如果T圖是G圖的一個生成子圖,且它又是‘樹”,則T是G的生成樹(span?ningtree)。設(shè)一個生成樹的邊的長度之和為權(quán),則具有最小權(quán)的生成樹稱為最優(yōu)樹(optionaltree)或最小生成樹。有n個頂點的樹,可能會有n-2個生
6、成樹,但僅有一個最小生成樹。構(gòu)造最小生成樹的方法常用避圈法或‘破圈法”。避圈法”中又分為以權(quán)重為主的Kruskal法和以點為主的Prim法,‘破圈法”則以逐步刪除邊”為基本思路?! 、谱钚∩蓸涞纳刹襟E①以基因頻率矩陣X為基礎(chǔ),利用歐氏距離構(gòu)造權(quán)矩陣;②以權(quán)矩陣為基礎(chǔ),利用Kruskal法構(gòu)造最小生成樹。首先選擇并連接權(quán)重或相似性最大(或距離最短)的兩點,再在剩余的點中選擇與這兩點之一相似性最大的點與之連接;再以相似性大小,逐次把剩余的點與巳連成的點連接起來,直至把所有點連接完為止,即可形成一個最小生成樹?! ?.2.3分割最小生成樹
7、用圖論中求‘頸”的方法[itruCiu-batii.proghtml<proghtml>/617/61756.htm)和PAST-1.30(byHammer[11].http://folk.uio.no/ohammer/past/dol)兩個軟件完成上述所有運算?! ?實例分析--中國26個漢族人群HLA- A位點群體遺傳空間結(jié)構(gòu)的圖論主坐標分析 2.1群體遺傳學(xué)資料根據(jù)不同地理環(huán)境,收集中國26個漢族群體的HLA-A基因多態(tài)性群體遺傳學(xué)調(diào)查數(shù)據(jù),以各基因的基因頻率為指標進行統(tǒng)計,標準為:①樣本含量大于100;②設(shè)一個人
8、群的基因頻率為一套,對每套數(shù)據(jù)先進行c2檢驗,剔除不符合Hardy-A-Alocusin類群體,需根據(jù)最小生成樹的鏈接關(guān)系而定。例如,甘肅與河南兩群體的空間位置雖很近,但它們在最小生成樹中不相連,二者分屬于