用身高和體重數(shù)據(jù)進行性別分類的報告

用身高和體重數(shù)據(jù)進行性別分類的報告

ID:31556649

大小:308.00 KB

頁數(shù):18頁

時間:2019-01-13

用身高和體重數(shù)據(jù)進行性別分類的報告_第1頁
用身高和體重數(shù)據(jù)進行性別分類的報告_第2頁
用身高和體重數(shù)據(jù)進行性別分類的報告_第3頁
用身高和體重數(shù)據(jù)進行性別分類的報告_第4頁
用身高和體重數(shù)據(jù)進行性別分類的報告_第5頁
資源描述:

《用身高和體重數(shù)據(jù)進行性別分類的報告》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、用身高和體重數(shù)據(jù)進行性別分類的實驗報告(二)一、基本要求1、試驗非參數(shù)估計,體會與參數(shù)估計在適用情況、估計結(jié)果方面的異同。2、試驗直接設(shè)計線性分類器的方法,與基于概率密度估計的貝葉斯分類器進行比較。3、體會留一法估計錯誤率的方法和結(jié)果。二、具體做法1、在第一次實驗中,挑選一次用身高作為特征,并且先驗概率分別為男生0.5,女生0.5的情況。改用Parzen窗法或者kn近鄰法估計概率密度函數(shù),得出貝葉斯分類器,對測試樣本進行測試,比較與參數(shù)估計基礎(chǔ)上得到的分類器和分類性能的差別。2、同時采用身高和體重數(shù)據(jù)作為特

2、征,用Fisher線性判別方法求分類器,將該分類器應(yīng)用到訓(xùn)練和測試樣本,考察訓(xùn)練和測試錯誤情況。將訓(xùn)練樣本和求得的決策邊界畫到圖上,同時把以往用Bayes方法求得的分類器也畫到圖上,比較結(jié)果的異同。3、選擇上述或以前實驗的任意一種方法,用留一法在訓(xùn)練集上估計錯誤率,與在測試集上得到的錯誤率進行比較。三、原理簡述及程序框圖1、挑選身高(身高與體重)為特征,選擇先驗概率為男生0.5女生0.5的一組用Parzen窗法來求概率密度函數(shù),再用貝葉斯分類器進行分類。以身高為例本次實驗我們組選用的是正態(tài)函數(shù)窗,即,窗寬為

3、(h是調(diào)節(jié)的參量,N是樣本個數(shù)),(d表示維度)。因為區(qū)域是一維的,所以體積為。Parzen公式為。故女生的條件概率密度為男生的條件概率密度為根據(jù)貝葉斯決策規(guī)則知如果,否則,。流程圖如下:2、要求是同時采用身高和體重數(shù)據(jù)作為特征,用Fisher線性判別方法求分類器,將該分類器應(yīng)用到訓(xùn)練和測試樣本,考察訓(xùn)練和測試錯誤情況。將訓(xùn)練樣本和求得的決策邊界畫到圖上,同時把以往用Bayes方法求得的分類器也畫到圖上,比較結(jié)果的異同。說明,取男生和女生的先驗概率分別為0.5,0.5。在設(shè)計貝葉斯分類器時,首先求各類樣本均

4、值向量,及,然后求各個樣本的來內(nèi)離散度矩陣,及,再求出樣本的總類內(nèi)離散度,及,根據(jù)公式求出把二維X空間投影到一維Y空間的最好的投影方向。再求出一維Y空間中各類樣本均值,其中,本次實驗的分界閾值我們用如下方法得到:,最后,將測試樣本中的值代入,求出y,并將其與y0來進行比較來分類。根據(jù)課本對Fisher線性判別法的介紹,得到的算法流程圖如下:3、選擇上述或以前實驗的任意一種方法,用留一法在訓(xùn)練集上估計錯誤率,與在測試集上得到的錯誤率進行比較。這里我們選擇Fisher線性判別法,用留一法來估計它在訓(xùn)練集上的錯誤

5、率,并將結(jié)果與Fisher線性判別法對測試集進行判別時得到的錯誤率進行比較。具體流程圖如下:四、實驗結(jié)果及分析總結(jié)1、得到結(jié)果如下表以身高作為特征h=4估計方法女生先驗概率男生先驗概率男生錯誤個數(shù)女生錯誤個數(shù)總錯誤男生錯誤率女生錯誤率總錯誤率Parzen窗法0.250.752283016%8.8%10%0.50.53443813.6%8%12.67%0.750.258028232%4%27.33%最大似然Bayes0.250.75206.667%0.50.5279%0.750.256020%以身高與體重作為

6、特征h=7估計方法女生先驗概率男生先驗概率男生錯誤個數(shù)女生錯誤個數(shù)總錯誤男生錯誤率女生錯誤率總錯誤率Parzen窗法0.250.757222914%8.8%9.67%0.50.53824015.2%4%13.33%0.750.252464818.4%4%16%最大似然Bayes0.250.7586143.2%12%4.67%0.50.52933211.6%6%10.67%0.750.25916023.6%2%20%分析:通過比較可知,在用最大似然估計這種參數(shù)估計方法和Parzen這種非參數(shù)估計方法來進行分類

7、時,最大似然估計判別的錯誤率低。2、得到結(jié)果如下(1)、用Fisher線性判別方法求分類器,將分類器應(yīng)用到訓(xùn)練和測試樣本上,比較其錯誤率判別對象男生錯誤個數(shù)女生錯誤個數(shù)總錯誤男生錯誤率女生錯誤率總錯誤率測試樣本2722910.8%4%9.67%訓(xùn)練樣本841216%8%12%分析:用訓(xùn)練樣本得到的分類器測試測試樣本時錯誤率低,測試結(jié)果較好,但測試訓(xùn)練樣本時,其錯誤率較高,測試結(jié)果不好。(2)、將訓(xùn)練樣本和求得的決策邊界畫到圖上先驗概略為0.5,0.5從圖中我們可以直觀的比較出對訓(xùn)練樣本Fisher判別比最大

8、似然Bayes判別效果更好。3、留一法測試結(jié)果如下:判別對象男生錯誤個數(shù)女生錯誤個數(shù)錯誤率測試樣本81328%訓(xùn)練樣本8412%分析:用留一法在訓(xùn)練樣本機上估計錯誤率時,錯誤率小于它在測試樣本集上得到的錯誤率,且留一法在測試樣本集上女生錯誤個數(shù)遠低于男生錯誤個數(shù)。五、體會這次實驗,我們組用了接近三天的時間,首先,我們對題目要求進行認真分析,在確保對題目完全理解的基礎(chǔ)上,開始一步一步分析,求解。對每個小題,及其每一

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。