用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc

用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc

ID:52722158

大小:276.50 KB

頁數(shù):19頁

時間:2020-03-30

用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc_第1頁
用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc_第2頁
用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc_第3頁
用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc_第4頁
用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc_第5頁
資源描述:

《用身高和體重數(shù)據(jù)進行性別分類的實驗報告.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、用身高和體重數(shù)據(jù)進行性別分類的實驗報告<二)一、基本要求1、實驗非參數(shù)估計,體會與參數(shù)估計在適用情況、估計結(jié)果方面的異同。2、實驗直接設(shè)計線性分類器的方法,與基于概率密度估計的貝葉斯分類器進行比較。3、體會留一法估計錯誤率的方法和結(jié)果。二、具體做法1、在第一次實驗中,挑選一次用身高作為特征,并且先驗概率分別為男生0.5,女生0.5的情況。改用Parzen窗法或者kn近鄰法估計概率密度函數(shù),得出貝葉斯分類器,對測試樣本進行測試,比較與參數(shù)估計基礎(chǔ)上得到的分類器和分類性能的差別。b5E2RGbCAP2、同時采用身高和體重數(shù)據(jù)作為特征,用Fisher線性判別方法求分類器,將該分類器應用到訓練和測

2、試樣本,考察訓練和測試錯誤情況。將訓練樣本和求得的決策邊界畫到圖上,同時把以往用Bayes方法求得的分類器也畫到圖上,比較結(jié)果的異同。p1EanqFDPw3、選擇上述或以前實驗的任意一種方法,用留一法在訓練集上估計錯誤率,與在測試集上得到的錯誤率進行比較。DXDiTa9E3d三、原理簡述及程序框圖1、挑選身高(身高與體重>為特征,選擇先驗概率為男生0.5女生0.5的一組用Parzen窗法來求概率密度函數(shù),再用貝葉斯分類器進行分類。RTCrpUDGiT以身高為例本次實驗我們組選用的是正態(tài)函數(shù)窗,即,窗寬為

3、en公式為。5PCzVD7HxA故女生的條件概率密度為19/19男生的條件概率密度為根據(jù)貝葉斯決策規(guī)則知如果,否則,。流程圖如下:2、要求是同時采用身高和體重數(shù)據(jù)作為特征,用Fisher線性判別方法求分類器,將該分類器應用到訓練和測試樣本,考察訓練和測試錯誤情況。將訓練樣本和求得的決策邊界畫到圖上,同時把以往用Bayes方法求得的分類器也畫到圖上,比較結(jié)果的異同。jLBHrnAILg說明,取男生和女生的先驗概率分別為0.5,0.5。在設(shè)計貝葉斯分類器時,首先求各類樣本均值向量,及,然后求各個樣本的來內(nèi)離散度矩陣,及,再求出樣本的總類內(nèi)離散度,及,根據(jù)公式求出把二維X空間投影到一維Y空間的最

4、好的投影方向。再求出一維Y空間中各類樣本均值19/19,其中,本次實驗的分界閾值我們用如下方法得到:,最后,將測試樣本中的值代入,求出y,并將其與y0來進行比較來分類。xHAQX74J0X根據(jù)課本對Fisher線性判別法的介紹,得到的算法流程圖如下:3、選擇上述或以前實驗的任意一種方法,用留一法在訓練集上估計錯誤率,與在測試集上得到的錯誤率進行比較。LDAYtRyKfE這里我們選擇Fisher線性判別法,用留一法來估計它在訓練集上的錯誤率,并將結(jié)果與Fisher線性判別法對測試集進行判別時得到的錯誤率進行比較。Zzz6ZB2Ltk19/19具體流程圖如下:四、實驗結(jié)果及分析總結(jié)1、得到結(jié)果

5、如下表以身高作為特征h=4估計方法女生先驗概率男生先驗概率男生錯誤個數(shù)女生錯誤個數(shù)總錯誤男生錯誤率女生錯誤率總錯誤率Parzen窗法0.250.752283016%8.8%10%19/190.50.53443813.6%8%12.67%0.750.258028232%4%27.33%最大似然Bayes0.250.75206.667%0.50.5279%0.750.256020%以身高與體重作為特征h=7估計方法女生先驗概率男生先驗概率男生錯誤個數(shù)女生錯誤個數(shù)總錯誤男生錯誤率女生錯誤率總錯誤率Parzen窗法0.250.757222914%8.8%9.67%0.50.53824015.2%4

6、%13.33%0.750.252464818.4%4%16%最大似然Bayes0.250.7586143.2%12%4.67%0.50.52933211.6%6%10.67%0.750.25916023.6%2%20%分析:通過比較可知,在用最大似然估計這種參數(shù)估計方法和Parzen這種非參數(shù)估計方法來進行分類時,最大似然估計判別的錯誤率低。dvzfvkwMI12、得到結(jié)果如下19/19<1)、用Fisher線性判別方法求分類器,將分類器應用到訓練和測試樣本上,比較其錯誤率判別對象男生錯誤個數(shù)女生錯誤個數(shù)總錯誤男生錯誤率女生錯誤率總錯誤率測試樣本2722910.8%4%9.67%訓練樣本8

7、41216%8%12%分析:用訓練樣本得到的分類器測試測試樣本時錯誤率低,測試結(jié)果較好,但測試訓練樣本時,其錯誤率較高,測試結(jié)果不好。rqyn14ZNXI<2)、將訓練樣本和求得的決策邊界畫到圖上先驗概略為0.5,0.5從圖中我們可以直觀的比較出對訓練樣本Fisher判別比最大似然Bayes判別效果更好。3、留一法測試結(jié)果如下:19/19判別對象男生錯誤個數(shù)女生錯誤個數(shù)錯誤率測試樣本81328%訓練樣本8412%分析:用

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。