資源描述:
《統(tǒng)計學(xué)課后簡答題》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、3.1數(shù)據(jù)預(yù)處理內(nèi)容:數(shù)據(jù)審核(完整性和準確性;適用性和實效性),數(shù)據(jù)篩選和數(shù)據(jù)排序。3.2分類數(shù)據(jù)和順序數(shù)據(jù)的整理和圖示方法各有哪些分類數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率等進行描述性分析??捎脳l形圖,帕累托圖和餅圖進行圖示分析。順序數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率。累計頻數(shù)和累計頻率等進行描述性分析??捎脳l形圖,帕累托圖和餅圖,累計頻數(shù)分布圖和環(huán)形圖進行圖示分析。3.3數(shù)據(jù)型數(shù)據(jù)的分組方法和步驟分組方法:單變量值分組和組距分組,組距分組又分為等距分組和異距分組。分組步驟:1確定組數(shù)2確定各組組距3根據(jù)分組整理成頻數(shù)分布表3.4直方圖和條形圖的區(qū)別1條形圖使用圖形
2、的長度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻率,寬度表示組距,2直方圖各矩形連續(xù)排列,條形圖分開排列,3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。3.5繪制線圖應(yīng)注意問題時間在橫軸,觀測值繪在縱軸。一般是長寬比例10:7的長方形,縱軸下端一般從0開始,數(shù)據(jù)與0距離過大的話用折斷符號折斷。3.6餅圖和環(huán)形圖的不同餅圖只能顯示一個樣本或總體各部分所占比例,環(huán)形圖可以同時繪制多個樣本或總體的數(shù)據(jù)系列,其圖形中間有個“空洞”,每個樣本或總體的數(shù)據(jù)系類為一個環(huán)。3.7莖葉圖比直方圖的優(yōu)勢,他們各自的應(yīng)用場合莖葉圖既能給出數(shù)據(jù)的分布情
3、況,又能給出每一個原始數(shù)據(jù),即保留了原始數(shù)據(jù)的信息。在應(yīng)用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。3.8鑒別圖標(biāo)優(yōu)劣的準則1一張好圖應(yīng)當(dāng)精心設(shè)計,有助于洞察問題的實質(zhì)。2一張好圖應(yīng)當(dāng)使復(fù)雜的觀點得到簡明、確切、高效的闡述。3一張好圖應(yīng)當(dāng)能在最短的時間內(nèi)以最少的筆墨給讀者提供最大量的信息。4一張好圖應(yīng)當(dāng)是多維的。5一張好圖應(yīng)當(dāng)表述數(shù)據(jù)的真實情況。3.9制作統(tǒng)計表應(yīng)注意的問題(1)合理安排統(tǒng)計表結(jié)構(gòu)(2)表頭一般包括表號,總標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)容(3)表中的上下兩條橫線一般用粗線,中間的其他用細線(4)在使用統(tǒng)計表時,必要時可在下方加注釋,注明數(shù)據(jù)來源。公式:組中
4、值=(上限+下限)/26.1統(tǒng)計量:設(shè)X1,X2…,Xn是從總體X中抽取的容量為n的一個樣本,如果由此樣本構(gòu)造一個函數(shù)T(X1,X2…,Xn),不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2…,Xn)是一個統(tǒng)計量。原因:為了使統(tǒng)計推斷成為可能。6.2T1和T2是6.3次序統(tǒng)計量:設(shè)X1,X2,…,Xn是從總體X中抽取的一個樣本,Xi稱為第i個次序統(tǒng)計量,它是樣本(X1,X2,…,Xn)滿足如下條件的函數(shù):每當(dāng)樣本得到一組觀測值X1,X2,…,Xn時,其由小到大的排序X1≤X2≤…≤Xi≤…≤Xn中,第i個值Xi就作為次序統(tǒng)計量Xi的觀測值,而X1,X2,…,Xn稱為次序統(tǒng)計量。6.4
5、統(tǒng)計量加工過程中一點信息都不損失的統(tǒng)計量為充分統(tǒng)計量6.5自由度:獨立變量的個數(shù)6.7抽樣分布:樣本統(tǒng)計量的概率分布是一種理論概率分布隨機變量是樣本統(tǒng)計量。6.8中心極限定理:設(shè)從均值為m,方差為s2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布8.1假設(shè)檢驗和參數(shù)估計有什么相同點和不同點?答:參數(shù)估計和假設(shè)檢驗是統(tǒng)計推斷的兩個組成部分,它們都是利用樣本對總體進行某種推斷,然而推斷的角度不同。參數(shù)估計討論的是用樣本統(tǒng)計量估計總體參數(shù)的方法,總體參數(shù)μ在估計前是未知的。而在參數(shù)假設(shè)檢驗中,則是先對μ的值提出一個假設(shè),然后
6、利用樣本信息去檢驗這個假設(shè)是否成立。8.2什么是假設(shè)檢驗中的顯著性水平?統(tǒng)計顯著是什么意思?答:顯著性水平是一個統(tǒng)計專有名詞,在假設(shè)檢驗中,它的含義是當(dāng)原假設(shè)正確時卻被拒絕的概率和風(fēng)險。統(tǒng)計顯著等價拒絕H0,指求出的值落在小概率的區(qū)間上,一般是落在0.05或比0.05更小的顯著水平上。8.3什么是假設(shè)檢驗中的兩類錯誤?答:假設(shè)檢驗的結(jié)果可能是錯誤的,所犯的錯誤有兩種類型,一類錯誤是原假設(shè)H0為真卻被我們拒絕了,犯這種錯誤的概率用α表示,所以也稱α錯誤或棄真錯誤;另一類錯誤是原假設(shè)為偽我們卻沒有拒絕,犯這種錯誤的概論用β表示,所以也稱β錯誤或取偽錯誤。8.4兩類錯誤之間存在什么樣的數(shù)
7、量關(guān)系?答:在假設(shè)檢驗中,α與β是此消彼長的關(guān)系。如果減小α錯誤,就會增大犯β錯誤的機會,若減小β錯誤,也會增大犯α錯誤的機會。8.5解釋假設(shè)檢驗中的P值答:P值就是當(dāng)原假設(shè)為真時所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率。(它的大小取決于三個因素,一個是樣本數(shù)據(jù)與原假設(shè)之間的差異,一個是樣本量,再一個是被假設(shè)參數(shù)的總體分布。)8.6顯著性水平與P值有何區(qū)別答:顯著性水平是原假設(shè)為真時,拒絕原假設(shè)的概率,是一個概率值,被稱為抽樣分布的拒絕域,大小由研究者事先確定,一般