資源描述:
《幾種常用的數(shù)據(jù)分析方法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、方差、相關(guān)與回歸分析主要內(nèi)容方差分析方差分析的過(guò)程單因素方差分析二因素方差分析相關(guān)分析相關(guān)分析的過(guò)程回歸分析一元回歸多元回歸方差方析方差分析是檢驗(yàn)兩個(gè)或兩個(gè)以上樣本均數(shù)間差異是否顯著的方法。在比較幾個(gè)組時(shí),H0假設(shè)通常是設(shè)各組平均值相等。檢驗(yàn)兩個(gè)均數(shù)間差別的顯著性可以用t檢驗(yàn)法,也可用方差分析法。方差分析的基本概念樣本均數(shù)間所以有差別,可能有兩種原因造成:首先它們必須有抽樣誤差(個(gè)體間變異的影響;其次,如果各組所接受的不同處理方法是有不同的作用的,那么,它也是由于處理不同所造成的。常用的方差分析法有以下4種:?jiǎn)我蛩胤讲罘治龆嘣?/p>
2、差分析重復(fù)測(cè)量方差分析3.舉例例1.完全隨機(jī)設(shè)計(jì)資料的方差分析(單因素方差分析)下面列出了15名英語(yǔ)專(zhuān)業(yè)學(xué)生四次聽(tīng)力測(cè)驗(yàn)的成績(jī)。這四次測(cè)驗(yàn)的內(nèi)容與主題各不相同,第一次的主題是科普讀物,第二次的是時(shí)事新聞,第三次的是名人軼事,第四次的是美國(guó)文化方面的短文。這四次聽(tīng)力考試的平均成績(jī)是否有顯著差異,即聽(tīng)力材料的主題與內(nèi)容對(duì)考試成績(jī)有沒(méi)有影響。表1測(cè)驗(yàn)1(科普讀物)測(cè)驗(yàn)2(時(shí)事新聞)測(cè)驗(yàn)3(名人軼事)測(cè)驗(yàn)4(美國(guó)文化)12159148616181110139101616101487171998141011。。。。。。。。。。。。相關(guān)與回
3、歸在醫(yī)學(xué)上人的身高與體重、體溫與脈搏次數(shù)、年齡與血壓、藥物劑量與療效等均有一定的聯(lián)系。說(shuō)明客觀事物或現(xiàn)象相互關(guān)系的密切程度并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)表示出來(lái),這是相關(guān)分析的任務(wù)。把客觀事物或現(xiàn)象間的關(guān)系用函數(shù)形式表示出來(lái),則是回歸分析所要解決的問(wèn)題。CORR過(guò)程計(jì)算變量間的相關(guān)系數(shù),包括PEARSON積矩相關(guān)系數(shù)等,同時(shí)給出單變量描述統(tǒng)計(jì)。REG過(guò)程是SAS中通用的基本的回歸分析過(guò)程,它是用最小二乘法原理求解線性回歸方程的有效過(guò)程。此外,因?yàn)橹鸩交貧w分析的方法在實(shí)際工作中應(yīng)用甚廣,故將其單獨(dú)提出來(lái)介紹如何使用REG過(guò)程進(jìn)行逐步回歸分析。
4、CORR過(guò)程相關(guān)分析相關(guān)是研究隨機(jī)變量之間相互關(guān)系的統(tǒng)計(jì)分析方法,它研究隨機(jī)變量之間相互關(guān)系的密切程度。線性相關(guān),又稱(chēng)簡(jiǎn)單相關(guān)。其統(tǒng)計(jì)指標(biāo)是PEARSON相關(guān)系數(shù)r。相關(guān)分析的取值在-1與+1之間,當(dāng)數(shù)值越接近+1或-1時(shí),說(shuō)明關(guān)系越密切,接近0時(shí),說(shuō)明幾乎沒(méi)有關(guān)系。相關(guān)分析要回答的問(wèn)題就是:變量x的一組高數(shù)值是不是與變量y的一組高數(shù)值有必然的聯(lián)系,或者變量x的高數(shù)值就導(dǎo)致了變量y的數(shù)值變低。作為根據(jù)的變量就是自變量,發(fā)生對(duì)應(yīng)變化的就是因變量。當(dāng)研究多個(gè)隨機(jī)變量之間的相互關(guān)系時(shí),可對(duì)變量進(jìn)行多元線性相關(guān)分析。多元線性相關(guān)的統(tǒng)計(jì)量
5、是全相關(guān)系數(shù)R和各偏相關(guān)系數(shù)。在多元線性相關(guān)分析中,變量之間的關(guān)系是錯(cuò)綜復(fù)雜的,兩個(gè)變量間的簡(jiǎn)單線性相關(guān)系數(shù)往往不能正確說(shuō)明兩者的真實(shí)關(guān)系,只有在其它變量固定,即扣除了其它變量的影響后,計(jì)算兩變量間的偏相關(guān)系數(shù)才能反映此兩變量的真實(shí)情況。當(dāng)變量不服從正態(tài)分布時(shí),例如按等級(jí)分類(lèi)或相對(duì)數(shù)資料,這時(shí)需用非參數(shù)相關(guān)分析方法,如等級(jí)相關(guān)分析法等。二變量相關(guān)分析12名英語(yǔ)專(zhuān)業(yè)學(xué)生參加了語(yǔ)音、聽(tīng)寫(xiě)和語(yǔ)法三項(xiàng)考試:語(yǔ)音考試與聽(tīng)寫(xiě)考試之間的相關(guān)程度?語(yǔ)音考試與語(yǔ)法考試之間的相關(guān)程度?聽(tīng)寫(xiě)與語(yǔ)法之間的相關(guān)程度?偏相關(guān)分析(partialcorrel
6、ations)云南省西雙版納地區(qū)是傣族同胞聚居區(qū),他們的母語(yǔ)是傣語(yǔ),但那里的兒童小學(xué)開(kāi)始學(xué)習(xí)漢語(yǔ),上中學(xué)時(shí)又學(xué)習(xí)英語(yǔ)。研究人員在該地區(qū)對(duì)30名受過(guò)高等教育的傣族成年人進(jìn)行了傣、漢、英三種語(yǔ)言水平的測(cè)試REG過(guò)程回歸是研究隨機(jī)變量(學(xué)習(xí)成績(jī))和非隨機(jī)變量(學(xué)習(xí)時(shí)間)之間的數(shù)量依存關(guān)系的統(tǒng)計(jì)分析方法。當(dāng)自變量X與因變量Y之間呈直線關(guān)系時(shí),稱(chēng)為直線回歸。直線回歸要求因變量Y是服從正態(tài)分布的且方差相等。當(dāng)自變量不只一個(gè)時(shí),可進(jìn)行多元線性回歸分析。研究一個(gè)因變量與多個(gè)自變量之間的線性依存關(guān)系,稱(chēng)為多元線性回歸。REG過(guò)程是用最小二乘法原理
7、求解線性回歸方程的過(guò)程。只有弄清楚兩個(gè)變量之間存在顯著的相關(guān)關(guān)系時(shí),才能使用直線回歸模型。舉例簡(jiǎn)單線性回歸分析某一中學(xué)高三老師在多次實(shí)踐的基礎(chǔ)上建立了一個(gè)試題庫(kù)。今年年初以來(lái),他們從該題庫(kù)中提出三套試卷,對(duì)高三學(xué)生進(jìn)行摸底考試。最近,高考前一個(gè)月,他們又根據(jù)今年最新考試大綱要求,設(shè)計(jì)了一份新的模擬考試,用該試卷對(duì)高三學(xué)生再次進(jìn)行摸底考試。題庫(kù)試題成績(jī)?cè)诙啻蟪潭壬夏茴A(yù)測(cè)新模擬試卷的成績(jī)。