資源描述:
《社會(huì)統(tǒng)計(jì)學(xué)復(fù)習(xí)整理》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、社會(huì)統(tǒng)計(jì)學(xué)復(fù)習(xí)整理一、變量的測(cè)量層次測(cè)量層次變量舉例數(shù)學(xué)特性單變量分析定類[nominal]區(qū)分類別性別職業(yè)婚姻狀況宗教信仰=≠⑴頻數(shù)分布、頻率分布⑵眾數(shù)、異眾比率定序[ordinal]區(qū)分類別后,還能排列高低、大小、先后、強(qiáng)弱等等級(jí)序列文化程度城市規(guī)模社會(huì)地位生活水平住房條件工作能力=≠、><⑴頻數(shù)分布、頻率分布⑵眾數(shù)、異眾比率⑶中位數(shù)、四分位差定距[interval]區(qū)分類別、等級(jí)后還能算出等級(jí)間的差距數(shù)量,但沒(méi)有實(shí)際意義的“0”收入年齡時(shí)間出生率性別比=≠、><、+-⑴頻數(shù)分布、頻率分布⑵眾數(shù)、異眾
2、比率⑶中位數(shù)、四分位差⑷平均數(shù)、標(biāo)準(zhǔn)差、離散系數(shù)定比[ratio]區(qū)分類別、等級(jí)后還能算出等級(jí)間的差距數(shù)量,但具有實(shí)際意義的“0”收入年齡時(shí)間出生率性別比=≠、><、+-、×÷⑴頻數(shù)分布、頻率分布⑵眾數(shù)、異眾比率⑶中位數(shù)、四分位差⑷平均數(shù)、標(biāo)準(zhǔn)差、離散系數(shù)二、判斷變量層次的技巧1.首先所有的變量都是定類變量。2.其次看變量的取值能否比較大小,不能這個(gè)變量只能是定類變量。3.最后如果這個(gè)變量能夠比較大小,那么就看變量取值加減乘除是否有意義,如果有意義就是定距變量,如果沒(méi)有意義就只能是定序變量。三、變量層次的
3、比較定類變量、定序變量和定比變量的數(shù)層次是從低到高排列的,高層次的變量同時(shí)具有低層次變量的功能。四、相關(guān)分析方法變量層次相關(guān)系數(shù)是否對(duì)稱取值范圍PRE意義檢驗(yàn)定類-定類定類-定序λ不對(duì)稱【0,1】有X2定序-定序G否【-1,1】有Z定類-定距定序-定距Eta2不對(duì)稱【0,1】無(wú)F定距-定距r對(duì)稱【-1,1】無(wú)Fr2對(duì)稱【0,1】有第二節(jié)簡(jiǎn)化一個(gè)變項(xiàng)的分布一、定類變量1.統(tǒng)計(jì)表:用表格的形式來(lái)表示變量頻次(或頻率)分布的一種工具。2.統(tǒng)計(jì)表必備的內(nèi)容:(1)表號(hào)、標(biāo)題(2)標(biāo)識(shí)行:變量名、對(duì)應(yīng)數(shù)據(jù)說(shuō)明(頻次
4、、頻率)(3)主題行:變量取值的統(tǒng)計(jì)數(shù)據(jù)(4)表尾:如果是引用必須說(shuō)明資料來(lái)源二、定序變量1.適合定序變量的簡(jiǎn)化資料的方法(1)累加次數(shù):把次數(shù)逐漸相加起來(lái),分為向上累加次數(shù)(cf↑)和向下累加次數(shù)(cf↓)。(2)累加頻率:把各級(jí)的百分率逐漸相加。也分為向下累加百分率和向下累加百分率。2.cf↑的計(jì)算方法就是按照變量取值的等級(jí)從低往高逐層相加。3.cf↓計(jì)算方法就是按照變量取值的等級(jí)從高往低逐層相加。?cf↑表示低于某個(gè)等級(jí)的頻數(shù)有多少?cf↓表示高于某個(gè)等級(jí)的頻數(shù)有多少三、定距變量1.定距變量的簡(jiǎn)化工
5、具是:分組、直方圖和折線圖。2.連續(xù)型定距變量的分組統(tǒng)計(jì)(1)組數(shù):分組的數(shù)量,一般5到7組合適,分為等距分組和非等距分組。(2)組限:包括上限(up)和下限(low)(3)標(biāo)識(shí)下限和標(biāo)識(shí)上限,例500—699(4)真實(shí)下限:標(biāo)識(shí)下限—0.5;真實(shí)上限:標(biāo)識(shí)上限+0.5.(5)組距:真實(shí)上限與真實(shí)下限之差。(6)組中值:真實(shí)上限與真實(shí)下限的平均值。第三節(jié)集中趨勢(shì)測(cè)量法1.集中趨勢(shì):用一個(gè)典型的變量值或特征值來(lái)代表全體變量的問(wèn)題,用這個(gè)數(shù)值來(lái)代表變項(xiàng)的資料分布,以反映資料的集結(jié)情況。2.集中趨勢(shì)測(cè)量的意義就
6、是可以根據(jù)這個(gè)代表值來(lái)估計(jì)或預(yù)測(cè)每個(gè)研究對(duì)象的數(shù)值。一、定類變量1.眾值(Mode)Mo:用具有頻數(shù)最多的變量的取值來(lái)表示變量的集中值。2.眾值的特征:(1):眾值理論上可以用于定類、定序和定距三個(gè)層次的變量來(lái)描述集中趨勢(shì),但是由于眾指不精確,一般只用于定類層次的變量。(2):眾值最好找,是最容易求出的值,但它精確度也是最差的。二、定序變量1.中位值(Md)。2.分組數(shù)據(jù)求中位值公式:Md=L+(n/2-cf↑/n)(U-L)L:中位值的真實(shí)下界值U:中位值的真實(shí)上界值n:中位值組的頻數(shù)cf↑:低于中位值
7、所在組的累加(向上)頻次N:調(diào)查總數(shù)Md位值:N/2二、定距變量1.均值(Mean):將變量的各個(gè)數(shù)值相加起來(lái),除以總個(gè)數(shù),求取一個(gè)平均值的數(shù)值,一般用ˉx來(lái)表示。2.均值的特征:l僅適合定距層次的變量l它最靈敏,預(yù)測(cè)的精確度最高l對(duì)資料所提供的信息運(yùn)用得最充分3.均值的求法(一)原始數(shù)據(jù)求均值:X=∑X1/N(X表示變量x的均值;∑X1表示變量觀察值的總和。)(二)根據(jù)頻次分布求均值:ˉx=∑n1X1∑n2(ˉx表示變量X的均值;∑n1X1表示變量的每一個(gè)取值和該變量頻數(shù)相乘的和;∑n2表示把變量的每個(gè)
8、取值下的頻次都加起來(lái),即調(diào)查總數(shù)N)(三)分組數(shù)據(jù)求均值:ˉx=∑n1b1∑n1(n1表示每組次數(shù),b表示每組的組中值,∑n1表示個(gè)案數(shù)目)第四節(jié)離散趨勢(shì)測(cè)量法l離散趨勢(shì)測(cè)量法:是求出一個(gè)值來(lái)表示個(gè)案與個(gè)案之間的差異情況。l離散趨勢(shì)或離散特征可以告訴我們估計(jì)值誤差的大小。一、定類變量(異眾比率V)V就是非眾值的次數(shù)與全部個(gè)案數(shù)目的比率。V=N-fmoN(N-全部個(gè)案數(shù)目;fmo-眾值的次數(shù))V值越小,眾值代表性越好。二、定序變