代謝組學數(shù)據(jù)分析的統(tǒng)計學方法.pdf

代謝組學數(shù)據(jù)分析的統(tǒng)計學方法.pdf

ID:52923716

大?。?70.46 KB

頁數(shù):4頁

時間:2020-03-31

代謝組學數(shù)據(jù)分析的統(tǒng)計學方法.pdf_第1頁
代謝組學數(shù)據(jù)分析的統(tǒng)計學方法.pdf_第2頁
代謝組學數(shù)據(jù)分析的統(tǒng)計學方法.pdf_第3頁
代謝組學數(shù)據(jù)分析的統(tǒng)計學方法.pdf_第4頁
資源描述:

《代謝組學數(shù)據(jù)分析的統(tǒng)計學方法.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。

1、中國衛(wèi)生統(tǒng)計2014年4月第31卷第2期代謝組學數(shù)據(jù)分析的統(tǒng)計學方法柯朝甫張濤武曉巖李康代謝組學是近年發(fā)展快速的一門學科,目前在醫(yī)(4)相互作用關(guān)系復雜:各種代謝物質(zhì)可能不僅學、植物學、微生物學、毒理學、藥物研發(fā)等諸多領(lǐng)域中具有簡單的相加效應,而且可能具有交互作用,從而增得到了廣泛的應用E1-5]。代謝組學研究產(chǎn)生大量的數(shù)加了識別這些具有復雜關(guān)系的生物標志物的難度。據(jù),這些數(shù)據(jù)具有高維、小樣本、高噪聲等復雜特征。(5)相關(guān)性和冗余性:各種代謝物并非獨立存在,如何從復雜的代謝組學數(shù)據(jù)中提取出有價值的信息,而是相互之間具有不同

2、程度的相關(guān)性,同時由于碎片、篩選出潛在的生物標志物成為近年來代謝組學研究的加合物和同位素的存在使得數(shù)據(jù)結(jié)構(gòu)存在很大的冗余熱點和難點。據(jù)此,本文針對目前代謝組學數(shù)據(jù)分析性,這就需要采用合理的統(tǒng)計分析策略來揭示隱藏其中的常用統(tǒng)計學方法及其研究進展進行介紹。中的復雜數(shù)據(jù)關(guān)系。(6)分布的不規(guī)則和稀疏性:代謝組學數(shù)據(jù)分布代謝組學數(shù)據(jù)的特點不規(guī)則,而且數(shù)據(jù)具有稀疏性(即有很多值為零),因代謝組學是系統(tǒng)生物學領(lǐng)域中繼基因組學和蛋白此,傳統(tǒng)的一些線性和參數(shù)分析方法此時可能失效。質(zhì)組學之后新近發(fā)展起來的一門學科,它通過檢測生數(shù)據(jù)的預處理物

3、體在受到外源刺激或基因修飾后其體內(nèi)代謝物質(zhì)的變化來探索整個生物體的代謝機制E6]。其研究對象代謝組學數(shù)據(jù)分析的目的是希望從中挖掘出生物為生物體內(nèi)所有內(nèi)源性小分子代謝物(分子量<相關(guān)信息,然而,代謝組學數(shù)據(jù)的變異來源很多,不僅1000Da),研究手段為高通量檢測技術(shù)和數(shù)據(jù)處理方包括生物變異,還包括環(huán)境影響和操作性誤差等方面。法,最終目標是數(shù)據(jù)建模和生物標志物的篩選。生物處理手段主要包括歸一化(standardization)、標準化樣品如血漿、尿液、組織等,經(jīng)過GC/MS、NMR、LC/(normalization),即中心

4、化(centering)和尺度化(scal—MS等高通量儀器檢測后,得到大量的圖譜數(shù)據(jù),使用ing),以及數(shù)據(jù)轉(zhuǎn)換(transformation)¨。歸一化是針XCMS_7等軟件對這些圖譜數(shù)據(jù)進行轉(zhuǎn)換,獲得用于對樣品的操作,由于生物個體問較大的代謝物濃度差統(tǒng)計分析的標準格式的數(shù)據(jù)。歸納起來,代謝組學數(shù)異或樣品采集過程中的差異(如取不同時間的尿樣),據(jù)具有以下特點:為了消除或減輕這種不均一性,一般使用代謝物的相(1)高噪聲:生物體內(nèi)含有大量維持自身正常功對濃度,即每個代謝物除以樣品的總濃度,以此來校正能的內(nèi)源性小分子,具有特

5、定研究意義的生物標志物個體差異或其他因素對代謝物絕對濃度的影響。標準只是其中很少一部分,絕大部分代謝物和研究目的化是對不同樣品代謝物的操作,即統(tǒng)計學意義上的變無關(guān)。量標準化。標準化的目的是消除不同代謝物濃度數(shù)量(2)高維、小樣本:代謝物的數(shù)目遠大于樣品個級的差別,但同時也可能會過分夸大低濃度組分的重數(shù),不適合使用傳統(tǒng)的統(tǒng)計學方法進行分析,多變量分要性,即低濃度代謝物的變異系數(shù)可能更大。數(shù)據(jù)轉(zhuǎn)析容易出現(xiàn)過擬合和維數(shù)災難問題。換是指對數(shù)據(jù)進行非線性變換,如log轉(zhuǎn)換和power(3)高變異性:一是不同代謝物質(zhì)的理化性質(zhì)差轉(zhuǎn)換等

6、。數(shù)據(jù)轉(zhuǎn)換的目的是將一些偏態(tài)分布的數(shù)據(jù)轉(zhuǎn)異巨大,其濃度含量動態(tài)范圍寬達7~9個數(shù)量級,換成對稱分布的數(shù)據(jù),并消除異方差性的影響,以滿足二是生物個體間存在各種來源的變異,如年齡、性別都一些線性分析技術(shù)的要求。不同的預處理方法會對統(tǒng)可能影響代謝產(chǎn)物的變化,三是儀器測量受各種因素計分析結(jié)果產(chǎn)生不同的影響(見表1),在實際應用中,影響,容易出現(xiàn)隨機測量誤差和系統(tǒng)誤差,這使得識別我們應該根據(jù)具體的研究目的、數(shù)據(jù)類型以及要選用有重要作用的生物標志物可能極其困難。的統(tǒng)計分析方法綜合考慮,選擇適當?shù)念A處理方式。例如,RobertA.van

7、denBerg等(2006)通過實際代謝國家自然科學基金資助(81172767);高等學校博士學科專組學數(shù)據(jù)的分析發(fā)現(xiàn),選用不同預處理方法在很大程項基金(20122307110004)度上影響著主成分分析(PCA)的結(jié)果,自動尺度化1.哈爾濱醫(yī)科大學衛(wèi)生統(tǒng)計學教研室(150081)(autoscaling)和全距尺度化(rangescaling)在對代謝2.山東大學衛(wèi)生統(tǒng)計學教研室△通信作者:李康,E—mail:likang@ems.hrbmu.edu.cn組學數(shù)據(jù)進行探索性分析時表現(xiàn)更優(yōu),其PCA分析后ChineseJo

8、umalofHealthStatistics,Apr2014,Vo1.31,No.2的結(jié)果在生物學上能夠得到更合理的解釋“。除了進行傳統(tǒng)的單變量假設(shè)檢驗分析,代謝組學表l常見的數(shù)據(jù)預處理方法分析中通常也計算代謝物濃度在兩組問的改變倍數(shù)值(foldchange),如計算某個代謝物濃度在兩組中的均值之比,判

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。