資源描述:
《全基因組關聯(lián)研究綜述.pdf》由會員上傳分享,免費在線閱讀,更多相關內容在應用文檔-天天文庫。
1、應用概率統(tǒng)計第三十卷ChineseJournalofAppliedProbability第一期2014年2月andStatisticsVo1.30NO.1Feb.2014全基因組關聯(lián)研究綜述潘東東李正幫(云南大學數學與統(tǒng)計學院,昆明,650091)(華中師范大學數學與統(tǒng)計學院,武漢,430079)張維李啟寨★(中國科學院數學與系統(tǒng)科學研究院,北京,100190)摘要本文是對近十年來科學前沿熱點問題之一的全基因組關聯(lián)研究(genome-wideassociationstudy,GWAS)的一個綜述,側重于介紹其中所用到的統(tǒng)計分析方法,討論當前
2、GWAS中存在的一些問題及挑戰(zhàn),并就其發(fā)展前景作一個展望.關鍵詞:病例一對照設計,全基因組關聯(lián)研究,單核苷酸多態(tài)性,穩(wěn)健檢驗,貝葉斯因子.學科分類號:O213,Q348.§1-引言1.1全基因組關聯(lián)研究的定義全基因組關聯(lián)研究(genome—wideassociationstudy,簡記為GWAS)是一種用來尋找與人類復雜疾病或性狀相關聯(lián)的遺傳變異的方法.這里的遺傳變異主要是指單核甘酸多態(tài)性(singlenucleotidepolymorphism,簡記為SNP).SNP是人類可遺傳的變異中最常見的一種,占所有己知多態(tài)性的90%以上,它在人類
3、基因組中廣泛存在,平均每隔100至300個堿基對中就存在一個SNP,其總數可達300萬個或更多.GWAS將人類基因組中數以百萬計的SNPs作為標記位點,從目標人群中隨機抽取一個較大規(guī)模的病例和對照樣本利用基因芯片技術進行測序,以獲取各樣本個體的DNA序列的觀測數據并歸整為各突變位點的基因型數據,然后對全部SNPs位點逐個地進行統(tǒng)計檢驗及分析,以期篩選出與復雜疾病有顯著關聯(lián)的遺傳位點,為多發(fā)性復雜疾病的診斷、預防和安全有效的治療提供理論依據.國家自然科學基金面上項目(11371353)、國家自然科學基金青年項目(11301465)、云南省應用
4、基礎研究計劃青年項目(2013FD001)~大學校級基金項目(2012cG018)資助.通訊作者,E-mail:liqz@amss.ac.ca.本文2013年11月1日收到.doi:10.3969/j.issn.1001—4268.2014.01—008第一期潘東東李正幫張維李啟寨:全基因組關聯(lián)研究綜述1.2全基因組關聯(lián)研究與候選基因關聯(lián)研究的聯(lián)系和區(qū)別候選基因關聯(lián)研究(candidategeneassociationstudy,簡記為CGAS)與全基因組關聯(lián)研究不同,它只關注一部分事先指定好的基因中的一個或多個遺傳變異與表現(xiàn)型或疾病狀態(tài)之
5、間的關聯(lián),而GWAS則是在人類全基因組范圍內掃描和檢驗遺傳變異與復雜疾病的關聯(lián).CGAS和GWAS本質上都屬于關聯(lián)研究,都是基于常見疾?。R娮儺恊ommondisease/commonvariant)假設,即遺傳因素對常見疾病易感性的影響體現(xiàn)在超過1%一5%的人群中出現(xiàn)一定數量的基因突變.它們的工作原理也基本一致,即通過比較SNP位點上的最小等位基因頻率(minorallelefrequency,簡記為MAF)在病例組和對照組間有無顯著性差異,進而得出該SNP是否與疾病存在著統(tǒng)計學關聯(lián)的結論.伴隨著GWAS的快速發(fā)展,常常將GWAS檢測出
6、的最顯著的SNPs作為CGAS進一步研究的對象,以縮小目標調查區(qū)域.1.3全基因組關聯(lián)研究的優(yōu)勢和成效GWAS具有以下幾點優(yōu)勢:(1)它不需要預先獲知復雜疾病或性狀的生物學通路,同時它無需家系數據,可避免家系患病成員DNA~J序標本難以獲取等限制因素;(2)它有可能發(fā)現(xiàn)一些新的通過其他方法識別不出來的基因;(3)它容易形成協(xié)作聯(lián)盟,除了GWAS外,他們往往會繼續(xù)后續(xù)分析的合作,從而有利于發(fā)現(xiàn)遺傳效應較低的易感基因位點;(4)它可以排除某些特定遺傳關聯(lián)的可能性;(5)它提供兩類結構突變的數據一序列偏差及拷貝數變異(copy—numbervar
7、iation,CNV),可為關聯(lián)分析提供更穩(wěn)健可靠的數據.GWAS取得的成效:2005年,Science雜志報道TKlein等(2005)對具有年齡相關性的視網膜黃色雀斑進行的GWAS研究,這也是第一項公開發(fā)表的利用商業(yè)化基因芯片進行復雜疾病GWAS的結果,并成功發(fā)現(xiàn)一個與視網膜黃色雀斑有顯著關聯(lián)的基因CFH.隨后在全世界范圍內,一系列針對人類復雜疾病或性狀的GWAS相繼開展,有關的研究成果陸續(xù)見諸報道.在過去的8年中,GWAS在腫瘤性疾病、內分泌系統(tǒng)疾病、心血管系統(tǒng)疾病、自身免疫性疾病、神經精神類疾病、皮膚病、感染性疾病等諸多復雜疾病領域
8、以及肥胖、皮膚色素、血脂等人類性狀方面取得了突飛猛進的研究成果,為眾多復雜疾病和性狀下一步的基因診斷及個體化治療奠定了理論基礎.根據美國國立衛(wèi)生研究院(NationalInsti