資源描述:
《醫(yī)學統(tǒng)計學課堂教學論文.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應用文檔-天天文庫。
1、醫(yī)學統(tǒng)計學課堂教學論文一、概率分布概率分布(probabilitydistribution)是醫(yī)學統(tǒng)計學中多種統(tǒng)計分析方法的理論基礎(chǔ)。授課內(nèi)容一般包括:二項分布、Possion分布、正態(tài)分布、t分布、F分布等。借助概率分布常??梢詭椭覀兞私馍笜说奶卣?、醫(yī)學現(xiàn)象的發(fā)生規(guī)律等等。例如,臨床檢驗中計量實驗室指標的參考值范圍就是依據(jù)正態(tài)分布和t分布的原理計算得到;許多醫(yī)學試驗的“陽性”結(jié)果服從二項分布,因此它被廣泛用于化學毒性的生物鑒定、樣本中某疾病陽性率的區(qū)間估計等;而一定人群中諸如遺傳缺陷、癌癥等發(fā)病率很低的非傳染性疾病患病數(shù)或死亡數(shù)的分布,單位面積(或
2、容積)內(nèi)細菌數(shù)的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對上述現(xiàn)象進行研究。在生物信息學中概率分布也有一定應用。例如,Poisson分布可以用于基因(蛋白質(zhì))序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(zhì)(或DNA)數(shù)據(jù)與公開數(shù)據(jù)庫進行相似性序列比對。對于序列a和b,BLAST發(fā)現(xiàn)的高得分匹配區(qū)稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)>t)可以依據(jù)Poisson分布的性質(zhì)計算得到。二、假設(shè)檢驗假設(shè)檢驗(hyp
3、othesis)是醫(yī)學統(tǒng)計學中統(tǒng)計推斷部分的重要內(nèi)容。假設(shè)檢驗根據(jù)反證法和小概率原理,首先依據(jù)資料性質(zhì)和所需解決的問題,建立檢驗假設(shè);在假設(shè)該檢驗假設(shè)成立的前提下,采用適當?shù)臋z驗方法,根據(jù)樣本算得相應的檢驗統(tǒng)計量;最后,依據(jù)概率分布的特點和算得的檢驗統(tǒng)計量的大小來判斷是否支持所建立的檢驗假設(shè),進而推斷總體上該假設(shè)是否成立。其基本方法包括:u檢驗、t檢驗、方差分析(ANOVA)和非參數(shù)檢驗方法。5假設(shè)檢驗為醫(yī)學研究提供了一種很好的由樣本推斷總體的方法。例如,隨機抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數(shù))與該年齡段兒童應有的標準平均身高(總體均
4、數(shù))做u檢驗,其檢驗結(jié)果可以幫助我們推斷出該市該年齡段兒童身高是否與標準身高一致,為了解該市該年齡段兒童的生長發(fā)育水平提供參考。又如,醫(yī)學中常常可以采用t檢驗、秩和檢驗比較兩種藥物的療效有無差別;用c2檢驗比較不同治療方法的有效率是否相同等等。這些假設(shè)檢驗的方法在生物實驗資料的分析前期應用較多,但由于研究目的和資料性質(zhì)不同,一般會對某些方法進行適當調(diào)整和結(jié)合。例如,基于基因芯片實驗數(shù)據(jù)尋找差異表達基因的問題。基因芯片(genechip)是近年來實驗分子生物學的技術(shù)突破之一,它允許研究者在一次實驗中獲得成千上萬條基因在設(shè)定實驗條件下的表達數(shù)據(jù)。為了從這海量的
5、數(shù)據(jù)中尋找有意義的信息,在對基因表達數(shù)據(jù)進行分析的過程中,找到那些在若干實驗組中表達水平有明顯差異的基因是比較基礎(chǔ)和前期的方法。這些基因常常被稱為“差異表達基因”,或者“顯著性基因”。如果將不同實驗條件下某條基因表達水平的重復測量數(shù)據(jù)看作一個樣本,尋找差異表達基因的問題其實就可以采用假設(shè)檢驗方法加以解決。如果表達數(shù)據(jù)服從正態(tài)分布,可以采用t-檢驗(或者方差分析)比較兩樣本(或多樣本)平均表達水平的差異。但是,由于表達數(shù)據(jù)很難滿足正態(tài)性假定,目前常用的方法基于非參數(shù)檢驗的思想,并對其進行了改進。該方法分為兩步:首先,選擇一個統(tǒng)計量對基因排秩,用秩代替表達值本
6、身;其次,為排秩統(tǒng)計量選擇一個判別值,在其之上的值判定為差異顯著。常用的排秩統(tǒng)計量有:任一特定基因在重復序列中表達水平M值的均值;考慮到基因在不同序列上變異程度的統(tǒng)計量,其中,s是M的標準差;以及用經(jīng)驗Bayes方法修正后的t-統(tǒng)計量:,修正值a由M的方差s2的均數(shù)和標準差估計得到。三、一些高級統(tǒng)計方法在基因研究中的應用(一)聚類分析聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據(jù)聚類對象的某些性質(zhì)與特征,運用統(tǒng)計分析的方法,將聚類對象比較相似或相近的歸并為同一類。使得各類內(nèi)的差異相對較小,類與類間的差異相對較大1。聚類分析作
7、為一種探索性的統(tǒng)計分析方法,其基本內(nèi)容包括:相似性度量方法、系統(tǒng)聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。5聚類分析可以幫助我們解決醫(yī)學中諸如:人的體型分類,某種疾病從發(fā)生、發(fā)展到治愈不同階段的劃分,青少年生長發(fā)育分期的確定等問題。近年來隨著基因表達譜數(shù)據(jù)的不斷積累,聚類分析已成為發(fā)掘基因信息的有效工具。在基因表達研究中,一項主要的任務(wù)是從基因表達數(shù)據(jù)中識別出基因的共同表達模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關(guān)聯(lián)性。這種探索完全未知的數(shù)據(jù)特征的方法就是聚類分析,生物信息學中又稱為無
8、監(jiān)督的分析(UnsupervisedAnalysis)。常用方法是