資源描述:
《Excel 2010在統(tǒng)計(jì)中的應(yīng)用——數(shù)據(jù)錄入和整理》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、Excel2010在統(tǒng)計(jì)中的應(yīng)用統(tǒng)計(jì)數(shù)據(jù)的收集與整理預(yù)習(xí)一、問卷的錄入1、在問卷回收后,請給每一份問卷編號,寫在問卷右上角,以方便查詢。2、請給每一個問題編號,例如Q1、Q2等等3、問卷錄入例如:關(guān)于手機(jī)情況的調(diào)查問卷Q1:請問您現(xiàn)在是否有手機(jī)?□1、有□2、沒有(請?zhí)餛12題)Q2:請問您當(dāng)初購買手機(jī)的原因?(多選,限選3項(xiàng))□1、方便聯(lián)絡(luò)□2、追求流行□3、別人送的□4、同學(xué)間比較□5、手機(jī)價(jià)格下降□6、網(wǎng)內(nèi)互打較便宜□7、其他Q3:請問您平均每月手機(jī)的話費(fèi)約元?Q3:請問您平均每月手機(jī)的話費(fèi)約多少錢?
2、□1、20元及以下□2、21~40元□3、41~60元□4、61~80元□5、81~100元□6、101元及以上錄入問卷,設(shè)計(jì)表格,“列”為問卷編號,“行”為問題編號,100份問卷單選題的編碼與錄入:給問題Q1的答案設(shè)置編碼,例如答案“有”編碼為1,“沒有”編碼為2問題Q3的每個選項(xiàng)題號就是一個編碼1~6,為有序數(shù)據(jù)。若只是進(jìn)行頻率分析或交叉分析很方便,但如要計(jì)算各種統(tǒng)計(jì)量,就得將其由區(qū)間轉(zhuǎn)換為組中值,才能進(jìn)行計(jì)算或檢驗(yàn)。多選題的編碼與錄入:多選題答案多個,編碼和錄入時(shí)要根據(jù)該題限制的答案數(shù)來保留列數(shù),例如限
3、選3項(xiàng),多選題的答案編號為Q2_1、Q2_2、Q2_3填空題的編碼與錄入:若是數(shù)值型數(shù)據(jù)則將數(shù)值直接輸入適當(dāng)?shù)牧屑纯?。?shù)值型數(shù)據(jù)可不經(jīng)任何轉(zhuǎn)換,計(jì)算各種統(tǒng)計(jì)量例如均值、標(biāo)準(zhǔn)差、最大值、最小值等。若是答案多樣的開放題,則需人工將答案分類整理編碼后再錄入到表格中。在問卷錄入中可能會涉及到的小技巧(1)填充“編輯”——>“填充”,再用填充柄逐個填充(2)凍結(jié)窗格使“問卷編號”列和“標(biāo)題”行固定顯示在A列和1行單擊B2單元格,表示要將B2單元格左邊的列和上方的行凍結(jié)“視圖”——>“窗口”,單擊“凍結(jié)拆分窗格”二、數(shù)據(jù)
4、的清理1、有效范圍的清理:對數(shù)據(jù)中的奇異值進(jìn)行清理問卷數(shù)據(jù)輸入完成后,利用數(shù)據(jù)“篩選”功能,找出數(shù)據(jù)范圍錯誤的個案。例如Q1是否有手機(jī),選擇答案只有兩個編碼“1”和“2”,若輸入數(shù)據(jù)的Q1這列中找到了3、4、5等其它數(shù)據(jù),則為錯誤數(shù)據(jù),需要按照編號去重新檢查問卷。(1)進(jìn)入篩選狀態(tài)(2)篩選數(shù)據(jù)。單擊要處理的數(shù)據(jù)列單元格的下拉箭頭按鈕,單擊輸入的錯誤編碼值(3)單擊確定即可找出該列中輸入錯誤的數(shù)據(jù)行(4)取消該列篩選,在該列的下拉菜單中單擊勾選“全選”(5)取消問卷篩選,在數(shù)據(jù)選項(xiàng)卡的“排序和篩選”組中單擊“
5、清除”按鈕。1、邏輯一致性的清理根據(jù)問卷中問題互相之間所存在的內(nèi)在邏輯聯(lián)系來檢查前后數(shù)據(jù)之間的合理性。例如核對“是否有手機(jī)”與“平均月費(fèi)”的數(shù)據(jù)。(1)進(jìn)入篩選狀態(tài)(2)篩選“是否有手機(jī)”等于“2”。(3)在篩選后的基礎(chǔ)上,在篩選“平均月費(fèi)”不為“空白”另外“有手機(jī)”而未填“平均月費(fèi)”也是一種錯誤。關(guān)于多項(xiàng)限選題的邏輯一致性問題,即多項(xiàng)限選題輸入的編碼值應(yīng)互不相同??梢岳幂o助列和公式實(shí)現(xiàn)。(1)在多項(xiàng)限選題的右側(cè),插入一空白列(稱為“輔助列”)。(2)在“輔助列”的第1行,輸入標(biāo)題。本題輸入“是否相同”(3
6、)在“輔助列”的第2行,輸入核對公式。=IF(COUNTA(C17:E17)<2,"",IF(OR(C17=D17,C17=E17,D17=E17),"F",""))如果多選題輸入的編碼個數(shù)在2個以下則無需核對,顯示為“空”,如果核對3個購買原因中有兩個相同,則顯示錯誤信息“F”(4)復(fù)制核對公式,利用填充柄(5)降序排列“輔助列”,則有問題的問卷將顯示在前,通過編號找到相應(yīng)的原問卷,查看問題所在并加以更正。(6)更正完成后可刪除“輔助列”2、清理重復(fù)輸入的問卷同一份問卷被重復(fù)輸入,在數(shù)據(jù)量大的情況下不易找出
7、,可以利用“高級篩選”來去掉重復(fù)的部分。(1)單擊問卷數(shù)據(jù)的任意一個單元格。(2)在“數(shù)據(jù)”選項(xiàng)卡的“排序和篩選”組中,單擊“高級篩選”(3)勾選“選擇不重復(fù)的記錄“,表示要將重復(fù)的記錄排除(4)單擊選中“將篩選結(jié)果復(fù)制到其他位置“,并在“復(fù)制到”框中填寫數(shù)據(jù)要復(fù)制到的起始單元格。一、單變量的一維頻率分析單選題的一維頻率分布表可以利用Excel的COUNTIF函數(shù)和COUNTA函數(shù)實(shí)現(xiàn)。1、COUNTIF函數(shù)的語法為COUNTIF(單元格區(qū)域,指定條件)該函數(shù)的功能是統(tǒng)計(jì)“單元格區(qū)域”中滿足“指定條件”的單元
8、格個數(shù)。2、COUNTA函數(shù)的語法為COUNTA(參數(shù)1,【參數(shù)2】,…)該函數(shù)的參數(shù)可以是數(shù)值、單元格或單元格區(qū)域。功能是統(tǒng)計(jì)非空單元格的個數(shù)。例如:數(shù)據(jù)“品牌支持率調(diào)查”,用COUNTIF函數(shù)求得支持各品牌的人數(shù)后,將其除以對該單選題的總回答人數(shù),得到品牌支持率的分布情況。(1)在問卷數(shù)據(jù)右邊E1:H10區(qū)域輸入標(biāo)題,在E列輸入品牌對應(yīng)的編碼1~6、輸入品牌名稱等。(2)單擊G2單元格,輸入公式