人類群體遺傳結(jié)構(gòu)的圖論主坐標(biāo)分析方法

人類群體遺傳結(jié)構(gòu)的圖論主坐標(biāo)分析方法

ID:22080629

大?。?1.00 KB

頁數(shù):5頁

時(shí)間:2018-10-27

人類群體遺傳結(jié)構(gòu)的圖論主坐標(biāo)分析方法_第1頁
人類群體遺傳結(jié)構(gòu)的圖論主坐標(biāo)分析方法_第2頁
人類群體遺傳結(jié)構(gòu)的圖論主坐標(biāo)分析方法_第3頁
人類群體遺傳結(jié)構(gòu)的圖論主坐標(biāo)分析方法_第4頁
人類群體遺傳結(jié)構(gòu)的圖論主坐標(biāo)分析方法_第5頁
資源描述:

《人類群體遺傳結(jié)構(gòu)的圖論主坐標(biāo)分析方法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、人類群體遺傳結(jié)構(gòu)的圖論主坐標(biāo)分析方法某人群中某位點(diǎn)上各等位基因的頻率,即是該群體在該位點(diǎn)上的遺傳結(jié)構(gòu);其全部位點(diǎn)上的基因頻率即是該人群的整個(gè)遺傳結(jié)構(gòu)。人群遺傳結(jié)構(gòu)的差異,實(shí)質(zhì)上是基因頻率的差異。人類群體遺傳變異性水平受人口遷移、人群融合、自然選擇、漂變、地理和社會(huì)隔離、突變等多因素的綜合影響,這些因素的綜合作用構(gòu)成了群體內(nèi)或群體間某位點(diǎn)或多位點(diǎn)的遺傳結(jié)構(gòu)。遺傳結(jié)構(gòu)數(shù)據(jù)可用基因頻率矩陣表示。由于群體內(nèi)或群體間廣泛存在基因多態(tài)性現(xiàn)象,一個(gè)位點(diǎn)常常包括多個(gè)等位基因,多個(gè)位點(diǎn)所包含的等位基因數(shù)目和組合方式則更是復(fù)雜多樣。如果僅用某位點(diǎn)中的一個(gè)等位基

2、因分析其群體遺傳結(jié)構(gòu),不能充分利用其遺傳變異信息,結(jié)論是片面的,故須對(duì)每個(gè)基因分別進(jìn)行分析。但是,利用不同基因所作的分析其結(jié)論往往不同,難以統(tǒng)一。傳統(tǒng)的解決方法之一是對(duì)基因頻率矩陣進(jìn)行主坐標(biāo)分析,將各群體的主坐標(biāo)作為新的綜合指標(biāo),再以散點(diǎn)圖的形式映射到二維或三維空間中,從而幫助研究者從整體上分析人類群體遺傳結(jié)構(gòu)的基本規(guī)律。因而,在群體遺傳學(xué)研究中被廣泛應(yīng)用但是,盡管主坐標(biāo)分析能在二維或三維空間中顯示各群體的遺傳結(jié)構(gòu),卻不能揭示各群體之間的內(nèi)在關(guān)系。本研究認(rèn)為,將圖論方法與主坐標(biāo)分析有機(jī)結(jié)合,利用圖論方法構(gòu)建各群體的最小生成樹(minimal

3、spanning中心化基因頻率矩陣中的元素為數(shù)值變量資料,tree,MST),并把最小生成樹整合到主坐標(biāo)散點(diǎn)圖可選擇歐氏(Euclidean)距離、馬氏(Manhattan)距上,即可進(jìn)一步揭示主坐標(biāo)散點(diǎn)圖中各群體之間離、曼哈頓(Block區(qū)組)距離、Bray-Curtis距離或的內(nèi)在遺傳結(jié)構(gòu)關(guān)系,稱之為圖論主坐標(biāo)分析Kulczynski距離等不相似性測度構(gòu)建群體(dK)間(graphtheoryprinc;palcoordinatesanaiysis)dcRibli的nn階不相似性矩陣;③將不相似性測度進(jìn)行0.5dK轉(zhuǎn)化,該轉(zhuǎn)換可保證在計(jì)

4、算過程中保持原有的不相似性;④對(duì)轉(zhuǎn)換后的矩陣進(jìn)行譜分解獲得特征根L及其對(duì)應(yīng)的特征向量U,并進(jìn)一步計(jì)算各主坐標(biāo)的貢獻(xiàn)率及其累計(jì)貢獻(xiàn)率;⑤根據(jù)Y=-u計(jì)算主坐標(biāo)值,取前1、主坐標(biāo)繪制二維主坐標(biāo)散點(diǎn)圖。1.2.2按圖論原理求過m維空間n個(gè)點(diǎn)的最小生成樹⑴圖論與最小生成樹的基本概念圖論是近年來較活躍的數(shù)學(xué)分支之一,其研究對(duì)象為圖。圖[7]是指某類具體事物的頂點(diǎn)(vertex,或節(jié)點(diǎn)note)以及它們間的聯(lián)系(圖1)。節(jié)點(diǎn)與節(jié)點(diǎn)之間用線段聯(lián)系,稱為邊(edge,或支路branch);某邊的端點(diǎn)稱為與該邊的關(guān)聯(lián)(incident),與同一邊關(guān)聯(lián)的兩個(gè)端

5、點(diǎn)稱為鄰接(adjacant);起點(diǎn)與終點(diǎn)重合的通路為回路(circuit)。若圖中兩端點(diǎn)間由一條通路連接,則兩端點(diǎn)是聯(lián)通的(connected),該圖稱為聯(lián)通圖;不含有回路的連通圖稱為“對(duì)”,樹中的邊稱為樹枝。可以證明樹中任兩頂點(diǎn)間必有一條且僅有一條通路。如果T圖是G圖的一個(gè)生成子圖,且它又是‘樹”,則T是G的生成樹(span?ningtree)。設(shè)一個(gè)生成樹的邊的長度之和為權(quán),則具有最小權(quán)的生成樹稱為最優(yōu)樹(optionaltree)或最小生成樹。有n個(gè)頂點(diǎn)的樹,可能會(huì)有n-2個(gè)生成樹,但僅有一個(gè)最小生成樹。構(gòu)造最小生成樹的方法常用避圈

6、法或‘破圈法”。避圈法”中又分為以權(quán)重為主的Kruskal法和以點(diǎn)為主的Prim法,‘破圈法”則以逐步刪除邊”為基本思路。⑵最小生成樹的生成步驟①以基因頻率矩陣X為基礎(chǔ),利用歐氏距離構(gòu)造權(quán)矩陣;②以權(quán)矩陣為基礎(chǔ),利用Kruskal法構(gòu)造最小生成樹。首先選擇并連接權(quán)重或相似性最大(或距離最短)的兩點(diǎn),再在剩余的點(diǎn)中選擇與這兩點(diǎn)之一相似性最大的點(diǎn)與之連接;再以相似性大小,逐次把剩余的點(diǎn)與巳連成的點(diǎn)連接起來,直至把所有點(diǎn)連接完為止,即可形成一個(gè)最小生成樹。1.2.3分割最小生成樹用圖論中求‘頸”的方法[itruCiu-batii.progprog

7、/617/61756.htm)和PAST-1.30(byHammer[11].http://folk.uio.no/ohammer/past/doA-Alocusin類群體,需根據(jù)最小生成樹的鏈接關(guān)系而定。例如,甘肅與河南兩群體的空間位置雖很近,但它們?cè)谧钚∩蓸渲胁幌噙B,二者分屬于不同的群體類型:甘肅群體與陜西群體相連,同屬西北漢族群體;而河南群體與江蘇群體相連,江蘇群體又與安徽、河北兩群體相連,四個(gè)群體同位于一個(gè)地理區(qū)域。3討論3.1圖論主坐標(biāo)軸分析中的不相似距離測度的選擇在圖論主坐標(biāo)軸分析中,可以用多種距離測度構(gòu)建不相似距離矩陣。實(shí)際

8、工作中選擇何種距離測度,需根據(jù)以下兩方法決定:①根據(jù)前1、主坐標(biāo)的累計(jì)貢獻(xiàn)率選擇:例如,本研究通過選取多種不相似測度構(gòu)建不相似矩陣,發(fā)現(xiàn)用歐氏距離時(shí)的前1、主坐標(biāo)的累計(jì)貢獻(xiàn)率最大

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。