資源描述:
《病因研究論文中統(tǒng)計(jì)學(xué)應(yīng)用的聚類分析碩士論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、河北醫(yī)科大學(xué)碩士學(xué)位論文病因研究論文中統(tǒng)計(jì)學(xué)應(yīng)用的聚類分析姓名:王立芹申請學(xué)位級別:碩士專業(yè):流行病與衛(wèi)生統(tǒng)計(jì)學(xué)指導(dǎo)教師:楊俊英;賈平20040301中文摘要病因研究論文中統(tǒng)計(jì)學(xué)應(yīng)用的聚類分析摘要目的:在科技期刊中,學(xué)術(shù)論文是反映科研工作質(zhì)量好壞和水平高低的一面鏡子,能夠全面而又徹底地映射出科研工作者科研創(chuàng)新的思路、統(tǒng)計(jì)研究設(shè)計(jì)的能力、數(shù)據(jù)處理的水平、結(jié)論的可信程度等綜合情況。自70年代起,國外就有不少統(tǒng)計(jì)學(xué)家對醫(yī)學(xué)雜志上發(fā)表的文章進(jìn)行統(tǒng)計(jì)學(xué)方面的分析,國內(nèi)從90年代也有了相關(guān)的研究,但資料來源的期刊面較窄,研究的指標(biāo)較少,縱向時(shí)間較短,采用的統(tǒng)計(jì)分析方法也較簡
2、單。同時(shí),考慮到在醫(yī)學(xué)領(lǐng)域中,致病因素的研究有著重大的科學(xué)與實(shí)際意義,只有清楚地認(rèn)識病因,才能治病治本,達(dá)到防病治病的目的,而有關(guān)這方面的研究目前國內(nèi)外還未見報(bào)道。為此,本文應(yīng)用系統(tǒng)聚類分析方法(hierarchicalclusteringanalysismethod),對在1994年至2001年間我國生物醫(yī)藥衛(wèi)生等研究領(lǐng)域內(nèi)科技期刊中的病因研究學(xué)術(shù)論文按統(tǒng)計(jì)學(xué)應(yīng)用存在的問題進(jìn)行分類,通過對各類的分析,找出其存在的問題,并提出一些可操作性的對策,為增強(qiáng)該領(lǐng)域里的科學(xué)性盡一點(diǎn)微薄之力。方法:從1994年至2001年間有關(guān)病因研究的學(xué)術(shù)論文中,隨機(jī)抽取1000篇,剔
3、除病例報(bào)告、統(tǒng)計(jì)方法介紹、普查等文章236篇,對剩余的764篇進(jìn)行系統(tǒng)評閱,每篇論文按其所來源的期刊名稱分為中華系列、中國系列、醫(yī)科大學(xué)學(xué)報(bào)、省級醫(yī)學(xué)期刊及其它醫(yī)學(xué)期刊(指不屬于前4‘類的期刊)5種,分別記錄每篇論文的實(shí)驗(yàn)設(shè)計(jì)方法(x,)、抽樣中文摘要方法(XZ)、樣本含量(X3)、統(tǒng)計(jì)分析方法(X4)、統(tǒng)計(jì)結(jié)論(X5)共5個(gè)指標(biāo)。I、Q型系統(tǒng)聚類分析:把實(shí)驗(yàn)設(shè)計(jì)方法(XI)、抽樣方法(Xz)、樣本含量(X3)、統(tǒng)計(jì)分析方法(X4)、統(tǒng)計(jì)結(jié)論(X5)作為指標(biāo),對764篇文章用Q型系統(tǒng)聚類方法進(jìn)行樣品聚類,聚類統(tǒng)計(jì)量用歐氏距離,用最長距離法合并兩類。具體分類個(gè)數(shù)的
4、確定方法如下:綜合考慮偽F,ccc、半偏尸和偽產(chǎn)統(tǒng)計(jì)量,偽F,cc。取局部最大值,半偏礦表示每一次合并對信息的損失程度,當(dāng)從G類合并成G-1類時(shí)信息損失很大時(shí),則聚為G類較合適,偽tz局部最大值處是不應(yīng)該合并的,應(yīng)為局部最大值處的類數(shù)加la2,秩和檢驗(yàn)用Kruskal-Wallis法秩和檢驗(yàn)比較不同期刊在各指標(biāo)不同等級的分布、各類關(guān)于各指標(biāo)不同等級的分布,如差別有統(tǒng)計(jì)學(xué)意義〔“=0.05),再對其進(jìn)行Nemenyi法兩兩比較的秩和檢驗(yàn)17,”·1813,x2檢驗(yàn)用x2檢驗(yàn)比較不同期刊在各類的構(gòu)成比,如差別有統(tǒng)計(jì)意義(a=0.05),用改變檢驗(yàn)水準(zhǔn)的方法進(jìn)行兩兩比
5、較,檢驗(yàn)水準(zhǔn)“用公式a’一。/心L361計(jì)算。所有數(shù)據(jù)的處理均使用SAS8.2統(tǒng)計(jì)分析軟件,其中Nemenyi法多組間的兩兩比較用SAS語言編程計(jì)算界值。結(jié)果:1、聚類分析顯示:764篇文章最后聚為5類比較合適,I類307篇,II類123篇,III類109篇,IV類102篇,V類123篇。2,Kruskal-Wallis法秩和檢驗(yàn):五種期刊在各指標(biāo)不同等級的分布的Kruskal-Wallis法中文摘要秩和檢驗(yàn)結(jié)果見表4一表8.H值分別為29.8330,13.5509,3.5943,33.5960,39.9826,P值分別為<0.0001,0.0099,0.463
6、7,<0.0001,<0.0001,除樣本含量指標(biāo)以外,其余4個(gè)指標(biāo),5種期刊的等級分布差別有統(tǒng)計(jì)學(xué)意義,再對其進(jìn)行Nemenyi法多組間的兩兩比較,檢驗(yàn)結(jié)果見表905類關(guān)于各指標(biāo)等級分布的Kruskal-Wallis法秩和檢驗(yàn)結(jié)果見表10一表14.H值分別為596.640,104.015,7.482,558.989,619.812,P值分別為<0.0001,<0.0001,0.112,<0.00011<0.0001,除樣本含量指標(biāo)以外,關(guān)于其余4個(gè)指標(biāo),5類的等級分布差別有統(tǒng)計(jì)學(xué)意義,再對其進(jìn)行Nemenyi法多組間的兩兩比較,檢驗(yàn)結(jié)果見表15。綜合此4個(gè)指標(biāo)
7、,5類文章統(tǒng)計(jì)學(xué)應(yīng)用質(zhì)量從好到差依次為I、W、V、111,II。3,x’檢驗(yàn):不同期刊在5類的構(gòu)成比比較結(jié)果見表16,X'=54.626,v=16,P<0.0001,不同期刊在5類的構(gòu)成比差別有統(tǒng)計(jì)學(xué)意義。進(jìn)一步兩兩比較的結(jié)果見表17,說明按a’=0.005(a=0.05)的水準(zhǔn),省級醫(yī)學(xué)期刊與中華系列、中國系列、其它醫(yī)學(xué)期刊有差別,其余任意兩種期刊間還不能認(rèn)為有差別。中華系列、中國系列、其它醫(yī)學(xué)期刊統(tǒng)計(jì)學(xué)應(yīng)用的質(zhì)量較好。結(jié)論:所聚5類文章統(tǒng)計(jì)學(xué)應(yīng)用的質(zhì)量不同,I類質(zhì)量最好,其余4類存在的錯(cuò)誤均不能忽視。各系列期刊都存在誤用統(tǒng)計(jì)學(xué)的現(xiàn)象,論文中統(tǒng)計(jì)學(xué)應(yīng)用的質(zhì)量也
8、存在差異,中華系列、中國