用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc

ID：52722158

大小：276.50 KB

頁數(shù)：19頁

時間：2020-03-30

資源描述：

《用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、用身高和體重數(shù)據(jù)進行性別分類的實驗報告<二）一、基本要求1、實驗非參數(shù)估計，體會與參數(shù)估計在適用情況、估計結(jié)果方面的異同。2、實驗直接設(shè)計線性分類器的方法，與基于概率密度估計的貝葉斯分類器進行比較。3、體會留一法估計錯誤率的方法和結(jié)果。二、具體做法1、在第一次實驗中，挑選一次用身高作為特征，并且先驗概率分別為男生0.5，女生0.5的情況。改用Parzen窗法或者kn近鄰法估計概率密度函數(shù)，得出貝葉斯分類器，對測試樣本進行測試，比較與參數(shù)估計基礎(chǔ)上得到的分類器和分類性能的差別。b5E2RGbCAP2、同時采用身高和體重數(shù)據(jù)作為特征，用Fisher線性判別方法求分類器，將該分類器應用到訓練和測

2、試樣本，考察訓練和測試錯誤情況。將訓練樣本和求得的決策邊界畫到圖上，同時把以往用Bayes方法求得的分類器也畫到圖上，比較結(jié)果的異同。p1EanqFDPw3、選擇上述或以前實驗的任意一種方法，用留一法在訓練集上估計錯誤率，與在測試集上得到的錯誤率進行比較。DXDiTa9E3d三、原理簡述及程序框圖1、挑選身高(身高與體重>為特征，選擇先驗概率為男生0.5女生0.5的一組用Parzen窗法來求概率密度函數(shù)，再用貝葉斯分類器進行分類。RTCrpUDGiT以身高為例本次實驗我們組選用的是正態(tài)函數(shù)窗，即，窗寬為

3、en公式為。5PCzVD7HxA故女生的條件概率密度為19/19男生的條件概率密度為根據(jù)貝葉斯決策規(guī)則知如果，否則，。流程圖如下：2、要求是同時采用身高和體重數(shù)據(jù)作為特征，用Fisher線性判別方法求分類器，將該分類器應用到訓練和測試樣本，考察訓練和測試錯誤情況。將訓練樣本和求得的決策邊界畫到圖上，同時把以往用Bayes方法求得的分類器也畫到圖上，比較結(jié)果的異同。jLBHrnAILg說明，取男生和女生的先驗概率分別為0.5,0.5。在設(shè)計貝葉斯分類器時，首先求各類樣本均值向量，及，然后求各個樣本的來內(nèi)離散度矩陣，及，再求出樣本的總類內(nèi)離散度，及，根據(jù)公式求出把二維X空間投影到一維Y空間的最

4、好的投影方向。再求出一維Y空間中各類樣本均值19/19，其中,本次實驗的分界閾值我們用如下方法得到：,最后，將測試樣本中的值代入，求出y，并將其與y0來進行比較來分類。xHAQX74J0X根據(jù)課本對Fisher線性判別法的介紹，得到的算法流程圖如下：3、選擇上述或以前實驗的任意一種方法，用留一法在訓練集上估計錯誤率，與在測試集上得到的錯誤率進行比較。LDAYtRyKfE這里我們選擇Fisher線性判別法，用留一法來估計它在訓練集上的錯誤率，并將結(jié)果與Fisher線性判別法對測試集進行判別時得到的錯誤率進行比較。Zzz6ZB2Ltk19/19具體流程圖如下：四、實驗結(jié)果及分析總結(jié)1、得到結(jié)果

5、如下表以身高作為特征h=4估計方法女生先驗概率男生先驗概率男生錯誤個數(shù)女生錯誤個數(shù)總錯誤男生錯誤率女生錯誤率總錯誤率Parzen窗法0.250.752283016%8.8%10%19/190.50.53443813.6%8%12.67%0.750.258028232%4%27.33%最大似然Bayes0.250.75206.667%0.50.5279%0.750.256020%以身高與體重作為特征h=7估計方法女生先驗概率男生先驗概率男生錯誤個數(shù)女生錯誤個數(shù)總錯誤男生錯誤率女生錯誤率總錯誤率Parzen窗法0.250.757222914%8.8%9.67%0.50.53824015.2%4

6、%13.33%0.750.252464818.4%4%16%最大似然Bayes0.250.7586143.2%12%4.67%0.50.52933211.6%6%10.67%0.750.25916023.6%2%20%分析：通過比較可知，在用最大似然估計這種參數(shù)估計方法和Parzen這種非參數(shù)估計方法來進行分類時，最大似然估計判別的錯誤率低。dvzfvkwMI12、得到結(jié)果如下19/19<1）、用Fisher線性判別方法求分類器，將分類器應用到訓練和測試樣本上，比較其錯誤率判別對象男生錯誤個數(shù)女生錯誤個數(shù)總錯誤男生錯誤率女生錯誤率總錯誤率測試樣本2722910.8%4%9.67%訓練樣本8

7、41216%8%12%分析：用訓練樣本得到的分類器測試測試樣本時錯誤率低，測試結(jié)果較好，但測試訓練樣本時，其錯誤率較高，測試結(jié)果不好。rqyn14ZNXI<2）、將訓練樣本和求得的決策邊界畫到圖上先驗概略為0.5,0.5從圖中我們可以直觀的比較出對訓練樣本Fisher判別比最大似然Bayes判別效果更好。3、留一法測試結(jié)果如下：19/19判別對象男生錯誤個數(shù)女生錯誤個數(shù)錯誤率測試樣本81328%訓練樣本8412%分析：用

當前文檔最多預覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 19



此文檔下載收益歸作者所有

當前文檔最多預覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學公式或PPT動畫的文件，查看預覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc

用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc

相關(guān)文章

相關(guān)標簽