資料整理.學(xué)習(xí)資料.ppt

資料整理.學(xué)習(xí)資料.ppt

ID:59820741

大?。?0.50 KB

頁(yè)數(shù):15頁(yè)

時(shí)間:2020-11-25

資料整理.學(xué)習(xí)資料.ppt_第1頁(yè)
資料整理.學(xué)習(xí)資料.ppt_第2頁(yè)
資料整理.學(xué)習(xí)資料.ppt_第3頁(yè)
資料整理.學(xué)習(xí)資料.ppt_第4頁(yè)
資料整理.學(xué)習(xí)資料.ppt_第5頁(yè)
資源描述:

《資料整理.學(xué)習(xí)資料.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、資料整理.9.1資料的確認(rèn)9.1.1目的:確認(rèn)問(wèn)卷為有效問(wèn)卷--指得是確定訪談已經(jīng)按照適當(dāng)?shù)姆绞竭M(jìn)行,目的是查明訪問(wèn)員有沒(méi)有造假,和在訪談時(shí)是否遵循了特定的關(guān)鍵程序。9.1.2方法和內(nèi)容通常采用電話確認(rèn)方法:復(fù)查比例一般為10-20%,內(nèi)容包括:確認(rèn)此人是否真的接受了調(diào)查被調(diào)查者是否符合條件:如收入是否達(dá)到規(guī)定標(biāo)準(zhǔn)確認(rèn)調(diào)查是否按要求的方式進(jìn)行如是否按照規(guī)定是在購(gòu)物中心接受的調(diào)查確認(rèn)調(diào)查是否完整其他:訪問(wèn)員是否彬彬有禮,是否明確介紹了委托人的身份和調(diào)查目的,是否衣冠整齊,被訪問(wèn)者對(duì)訪問(wèn)有什么意見(jiàn)等9.2編輯所謂編輯是檢查訪問(wèn)員謬誤的過(guò)程,在數(shù)據(jù)錄入之前,至少應(yīng)該經(jīng)過(guò)

2、兩次編輯處理。一次是執(zhí)行調(diào)查的公司進(jìn)行編輯,然后再由雇傭這些實(shí)地服務(wù)企業(yè)的調(diào)研公司編輯整理。編輯由人工操作,內(nèi)容:確定訪問(wèn)員是否沒(méi)有問(wèn)某些問(wèn)題。如在一份收集調(diào)查中,所有的人都應(yīng)該回答性別,但問(wèn)卷沒(méi)有表明,可以通過(guò)電話聯(lián)系,但很多情況下,時(shí)間不允許,因此很有可能問(wèn)卷要被放棄。核實(shí)問(wèn)卷,以保證能夠遵循了規(guī)定的跳答模式檢查開(kāi)放式問(wèn)題的答案。開(kāi)放式問(wèn)題要求逐字記錄答案,不以任何形式的訪問(wèn)員工作重新解釋、表達(dá)和插入自己的語(yǔ)言,同時(shí)也要求對(duì)回答進(jìn)行進(jìn)一步的“探查”。例如:記錄不當(dāng)?shù)睦樱簽槭裁丛诒姸嗟目旖莺头奖愕牟宛^中經(jīng)常選擇去漢堡王?回答:顧客似乎覺(jué)得漢堡王有更加美味的事務(wù)

3、和一流的服務(wù)環(huán)境沒(méi)有進(jìn)一步探查例如問(wèn)題同上記錄:因?yàn)槲蚁矚g正確的記錄和探查問(wèn)題同上答案:因?yàn)槲蚁矚g它――我喜歡并經(jīng)常去那里,――探查:因?yàn)槟鞘请x我工作的地方最近的餐館,還有其他原因嗎?沒(méi)有了9.3編碼1、封閉式問(wèn)題編碼2、開(kāi)放式問(wèn)題編碼見(jiàn)教材P3209.4數(shù)據(jù)整理見(jiàn):03營(yíng)銷各組整理資料9.5數(shù)據(jù)預(yù)處理9.5.1缺失值處理缺失值是指在數(shù)據(jù)采集與整理過(guò)程中丟失的內(nèi)容。一般情況下,數(shù)據(jù)都是以關(guān)系型表的方式采集的,如下表是某次調(diào)查中一些受訪者的基本情況:姓名年齡性別職業(yè)收入張三20-護(hù)士1500李四30女醫(yī)生2000王五35男醫(yī)生3000趙六-女護(hù)士1000如果在表格中

4、,某一個(gè)數(shù)據(jù)采集時(shí)無(wú)法獲得,就會(huì)出現(xiàn)缺失值,例如在上表中“張三”的性別和“趙六”的年齡就出現(xiàn)了缺失。缺失值的處理一般有兩種方式:一是刪除對(duì)應(yīng)的記錄。如在上例中,如果張三的性別沒(méi)有記錄,出現(xiàn)缺失,則將張三的所有信息全部從數(shù)據(jù)庫(kù)中刪掉。這種方式在數(shù)據(jù)缺失非常少的情況下是可行的,但如果各個(gè)項(xiàng)目中都有少數(shù)的數(shù)據(jù)缺失存在,對(duì)所有缺失的記錄都進(jìn)行刪除可能就會(huì)使總樣本量變得非常小,從而損失許多有用信息缺失值處理的第二種方式是進(jìn)行插值處理,所謂插值,是指人為地用一個(gè)數(shù)值去替代缺失的數(shù)值。插值處理根據(jù)插值的不同,有如下一些方法:1.隨機(jī)插值根據(jù)缺失值的各種可能情況,等概率地進(jìn)行插值

5、。例如在上例中,“張三”的性別有兩種可能性,一是“男”,二是“女”,可以簡(jiǎn)單地?cái)S一枚硬幣,如果正面朝上,則賦值為“男”,如果反面朝上,則賦值為“女”。2、依概率插值隨機(jī)插值是假定各種一個(gè)變量取各種值的可能性是相等的,但有些情況下,我們可以事先知道一個(gè)變量取各種值的概率,例如,我們知道在上述的單位中,女性占的比例是75%,男性的比例是25%,則在對(duì)“張三”的性別進(jìn)行賦值時(shí),不是按50%概率賦為“女”,而是按75%概率賦為“女”。3.就近插值就近插值是指根據(jù)缺失記錄附近的其他記錄的情況對(duì)缺失值進(jìn)行插值,例如在上例中,“張三”的性別出現(xiàn)缺失,此時(shí)可以用其鄰近的“李四”的

6、性別數(shù)據(jù)替代“張三”的性別數(shù)據(jù),由于“李四”的性別為“女”,所以將“張三”的性別也賦為“女”。就近插值是依概率插值的一種簡(jiǎn)化處理,設(shè)想在整個(gè)單位的職工中,女性占的比例是75%,則在一般情況下,與張三鄰近的記錄性別為“女”的概率也應(yīng)當(dāng)為75%,就近插值實(shí)際上就是依概率插值。4.分類插值依概率插值是將記錄置于總體的背景上進(jìn)行插值,沒(méi)有充分利用記錄的其他信息。如果在記錄的其他信息中有某些項(xiàng)目與缺失項(xiàng)目存在相關(guān)性,則可以根據(jù)這些輔助信息對(duì)總體進(jìn)行分類,在每一類內(nèi)部進(jìn)行插值處理。例如在上例中,“張三”的職業(yè)是“護(hù)士”,假定該單位中95%的“護(hù)士”性別為“女”,則在進(jìn)行插值是

7、,就不是使用全單位的女性比例75%,而是使用“護(hù)士”中的女性比例95%對(duì)“張三”的性別進(jìn)行賦值。本章小結(jié)此課件下載可自行編輯修改,僅供參考! 感謝您的支持,我們努力做得更好!謝謝

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。