資源描述:
《應(yīng)用統(tǒng)計(jì)學(xué)筆記new》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、應(yīng)用統(tǒng)計(jì)學(xué)筆記應(yīng)用統(tǒng)計(jì)學(xué)筆記第一章 統(tǒng)計(jì)方法一、統(tǒng)計(jì)依其功能分成「理論統(tǒng)計(jì)學(xué)」(purestatistics)和「應(yīng)用統(tǒng)計(jì)學(xué)」(appliedstatistics):(一)理論統(tǒng)計(jì)學(xué):指的是創(chuàng)造出一個(gè)可以用于統(tǒng)計(jì)的定理或公式、或?qū)τ诂F(xiàn)有統(tǒng)計(jì)的定理或公式作更合理的解釋。是偏向理論的推論過程和結(jié)果。(二)應(yīng)用統(tǒng)計(jì)學(xué):指的是如何正確使用理論統(tǒng)計(jì)學(xué)者所創(chuàng)造出來的統(tǒng)計(jì)定理或公式,達(dá)到評估某一事件的目的,我們只要了解在何種狀況下該用那一個(gè)數(shù)學(xué)方程式或定理,以及該如何解出所需要的數(shù)學(xué)方程式就可以了。是偏向解決實(shí)際問題的推論過程和結(jié)果,協(xié)助各行各業(yè)判斷或預(yù)測某一特定事件、在未來產(chǎn)生某種結(jié)果的機(jī)會有多大,
2、是預(yù)測未來的有效工具。二、統(tǒng)計(jì)方法的應(yīng)用是為了發(fā)現(xiàn)或解決某一特定群體的問題,這一產(chǎn)生或需要解決問題的特定群體稱為母體(population)、群體或母群體。母體所包含個(gè)體數(shù)量通常都很龐大、或數(shù)量具有不確定性,在正常的狀況下,是不可能讓母體內(nèi)的每一個(gè)個(gè)體在統(tǒng)計(jì)過程中適時(shí)出現(xiàn),因此只能選擇某些個(gè)體當(dāng)作評估或研究的對象,選擇個(gè)體的過程稱為抽樣(sampling),所抽到的個(gè)體稱為樣本(sample)或樣品。三、搜集資料的方法有很多種,視情況而定,大致上可分為三類:(一)直接從樣本而又不干擾或影響樣本的情況下得到數(shù)據(jù)的方法,稱為調(diào)查法(survey)。(二)直接從樣本而且必須加入干擾或影響樣本因
3、素的情況下得到數(shù)據(jù)的方法,稱為實(shí)驗(yàn)法(experiment)。(三)間接得到所要評估或研究的群體或特性數(shù)據(jù)的方法,稱為文件(docments)應(yīng)用法。四、用簡短的文字、統(tǒng)計(jì)表、統(tǒng)計(jì)圖或方程式等方式,只能顯示樣本數(shù)據(jù)整體分布的特性,但還夠具體。所以最好能用少數(shù)幾個(gè)數(shù)據(jù)具體表示樣本數(shù)據(jù)的特性,這些能表示樣本數(shù)據(jù)特性的具體數(shù)據(jù),就稱為統(tǒng)計(jì)量(static)或表征數(shù)。例如搜集到的作文成績統(tǒng)計(jì)出甲、乙和丙的總?cè)藬?shù)還算出百分比,或80分以上、70?79、60?69、60分以下的總?cè)藬?shù)后,還算出平均分?jǐn)?shù)或高低分?jǐn)?shù)之間的差距等,這樣才能具體顯示樣本的整體作文程度。常用的統(tǒng)計(jì)量有百分比、平均數(shù)、中位數(shù)、眾
4、數(shù)、四分位數(shù)、全距、變異數(shù)、標(biāo)準(zhǔn)偏差和變異系數(shù)等。這樣用簡短的文字、統(tǒng)計(jì)表、統(tǒng)計(jì)圖、方程式或統(tǒng)計(jì)量等來描述或分析樣本數(shù)據(jù)特性的方法,稱為描述統(tǒng)計(jì)學(xué)(descriptivestatistics),也就是統(tǒng)計(jì)分析的主要內(nèi)容。由樣本得到的群體現(xiàn)象或特性,利用機(jī)率分布,預(yù)測或判斷母體群體現(xiàn)象或特性的方法和過程,稱為推論統(tǒng)計(jì)學(xué)(inferentialstatistics)。表示樣本群體現(xiàn)象或特性的數(shù)值稱為統(tǒng)計(jì)量,表示母體群體現(xiàn)象或特性的數(shù)值稱為參數(shù)值(paramenters)或母數(shù)。五、一般來說不同的樣本,會得到不同的統(tǒng)計(jì)量,所以統(tǒng)計(jì)量數(shù)值的出現(xiàn)是憑運(yùn)氣或機(jī)會,運(yùn)氣或機(jī)會出現(xiàn)的可能性大小稱為機(jī)率(
5、probability),如果把各統(tǒng)計(jì)量數(shù)值出現(xiàn)的機(jī)率按某種規(guī)則性加以排列,排列結(jié)果稱為機(jī)率分布(probabilitydistribution)。如果知道某種統(tǒng)計(jì)量的機(jī)率分布情形,將一次抽樣得到的統(tǒng)計(jì)量數(shù)值,放在機(jī)率分布的適當(dāng)位置上,就能推論出母體具體的群體現(xiàn)象或特性,所以機(jī)率分布是樣本具體的群體現(xiàn)象或特性、推論出母體具體的群體現(xiàn)象或特性的橋梁。例如,一般人常聽到的常態(tài)分布是一種常見的機(jī)率分布,如果高中生的法律常識測驗(yàn)成績是常態(tài)分布,則由樣本得到的平均成績在常態(tài)分布的位置,可以推論出今年高中生的法律常識是否優(yōu)于往年,其結(jié)果可以作為教育改革的參考。六、推論母數(shù)主要有二種方法:估計(jì)(est
6、imation)和假設(shè)檢定(hypothesistesting):(一)估計(jì):是利用統(tǒng)計(jì)量,估算出母體相對應(yīng)的參數(shù)值。(二)假設(shè)檢定:是先假設(shè)母體的參數(shù)值,然后用得自樣本的相對應(yīng)統(tǒng)計(jì)量來檢定假設(shè)的參數(shù)值是否正確。(三)估計(jì)和假設(shè)統(tǒng)計(jì)最大的不同點(diǎn)就是:估計(jì)是用統(tǒng)計(jì)量當(dāng)作推論基礎(chǔ),而假設(shè)檢定是用所假設(shè)母體的參數(shù)值當(dāng)作推論基礎(chǔ)。(四)例如,候選人不知道得票率,民調(diào)后得到支持度35%(統(tǒng)計(jì)量),經(jīng)推論后,得到誤差是3%,預(yù)測其支持度是35%±3%(估計(jì)母數(shù)),這種推論方法稱為估計(jì);候選人先預(yù)測得票率是40%以上(假設(shè)母數(shù)),民調(diào)后得到支持度是42%(統(tǒng)計(jì)量),經(jīng)推論后,判斷候選人預(yù)測得票率可能是
7、正確的,這種推論方法稱為假設(shè)檢定。第13頁,共13頁 蘇東福應(yīng)用統(tǒng)計(jì)學(xué)筆記第二章 母體與樣本一、當(dāng)對某群體中的某些事件發(fā)生興趣時(shí),群體已大致形成,這一特定群體在統(tǒng)計(jì)上稱為母體(population)、群體或母群體。母體可能是具有某種共同特性傾向的一群人或物,換句話說,母體是由許多個(gè)體或基本單元(elements)所組成的。母體依其個(gè)體的組成型態(tài),可分為二種:(一)有限母體(finitepopulati