用身高和體重數(shù)據(jù)進(jìn)行性別分類的實驗報告.docx

用身高和體重數(shù)據(jù)進(jìn)行性別分類的實驗報告.docx

ID:57441612

大?。?6.84 KB

頁數(shù):12頁

時間:2020-08-17

用身高和體重數(shù)據(jù)進(jìn)行性別分類的實驗報告.docx_第1頁
用身高和體重數(shù)據(jù)進(jìn)行性別分類的實驗報告.docx_第2頁
用身高和體重數(shù)據(jù)進(jìn)行性別分類的實驗報告.docx_第3頁
用身高和體重數(shù)據(jù)進(jìn)行性別分類的實驗報告.docx_第4頁
用身高和體重數(shù)據(jù)進(jìn)行性別分類的實驗報告.docx_第5頁
資源描述:

《用身高和體重數(shù)據(jù)進(jìn)行性別分類的實驗報告.docx》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、實驗一用身高和/或體重數(shù)據(jù)進(jìn)行性別分類姓名:學(xué)號:姓名:學(xué)號:一、實驗?zāi)康?)加深對Bayes分類器原理的理解和認(rèn)識2)掌握Bayes分類器的設(shè)計方法二、實驗內(nèi)容1)用FAMALE.TXT和MALE.TXT的數(shù)據(jù)作為訓(xùn)練樣本集,建立Bayes分類器; 2)用測試樣本數(shù)據(jù)test2.txt對該分類器進(jìn)行測試; 3)調(diào)整特征、分類器等方面的一些因素,考察它們對分類器性能的影響,從而加深對所學(xué)內(nèi)容的理解和感性認(rèn)識。三、實驗步驟1)應(yīng)用單個特征進(jìn)行實驗:以(a)身高或者(b)體重數(shù)據(jù)作為特征,在正態(tài)分布假設(shè)下利

2、用最大似然法或者貝葉斯估計法估計分布密度參數(shù),建立最小錯誤率Bayes分類器,寫出得到的決策規(guī)則,將該分類器應(yīng)用到測試樣本,考察測試錯誤情況.在分類器設(shè)計時可以考察采用不同先驗概率(如0.5對0.5,0.75對0.25,0.9對0.1等)進(jìn)行實驗,考察對決策規(guī)則和錯誤率的影響;2)用兩個特征進(jìn)行實驗:同時采用身高和體重數(shù)據(jù)作為特征,分別假設(shè)二者相關(guān)或不相關(guān),在正態(tài)分布假設(shè)下估計概率密度,建立最小錯誤率Bayes分類器,寫出得到的決策規(guī)則,將該分類器應(yīng)用到訓(xùn)練/測試樣本,考察訓(xùn)練/測試錯誤情況。比較相關(guān)假

3、設(shè)和不相關(guān)假設(shè)下結(jié)果的差異。在分類器設(shè)計時可以考察采用不同先驗概率(如0.5vs.0.5,0.75vs.0.25,0.9vs.0.1等)進(jìn)行實驗,考察對決策和錯誤率的影響;3)自行給出一個決策表,采用最小風(fēng)險的Bayes決策重復(fù)上面的某個或全部實驗。四、原理簡述、程序流程圖及相應(yīng)結(jié)果(一)、實驗一在正態(tài)分布假設(shè)下,利用最大似然法估計分布密度函數(shù),具體過程如下:1、原理(1)、一維情況:n=1對于每個學(xué)習(xí)樣本只有一個特征(取身高為特征)的簡單情況:——學(xué)習(xí)樣本的算術(shù)平均——樣本方差的最大似然估計(2)、最

4、小錯誤率Bayes分類器多元正態(tài)概率型下的最小錯誤率貝葉斯判別函數(shù)(一般情況)。判別函數(shù):決策規(guī)則:2、具體步驟如下A).算出各類別特征值的均值B).求出特征值的協(xié)方差矩陣C).將第二步所得矩陣代入判別函數(shù)、D).將待測試樣本集數(shù)據(jù)依次代入—,若—>0,則判斷其為第一類,反之為第二類。3、流程圖NY最大似然法求出均值與協(xié)方差分別代入判別函數(shù)確定特征及先驗概率第一類第二類(5)實驗結(jié)果及分析表1.只考慮身高的不同先驗概率下男女判錯統(tǒng)計表女生先驗概率P(1)男生先驗概率P(2)訓(xùn)練樣本判錯個數(shù)N1訓(xùn)練樣本錯

5、誤率Η1測試樣本1判錯個數(shù)N2測試樣本1錯誤率Η2測試樣本2判錯個數(shù)N3測試樣本2錯誤率Η30.50.51616%411.5%6622%0.250.751414%38.5%3210.7%0.10.91414%25.7%279%由表可知:對于訓(xùn)練樣本,當(dāng)女生先驗概率為0.25或0.1時,判別錯誤率最小;對于測試樣本,當(dāng)女生先驗概率為0.1時,測試樣本1判別錯誤率最小;為0.1時,測試樣本2判別錯誤率最??;表2.只考慮體重的不同先驗概率下男女判錯統(tǒng)計表女生先驗概率P(1)男生先驗概率P(2)訓(xùn)練樣本判錯個數(shù)

6、N1訓(xùn)練樣本錯誤率Η1測試樣本1判錯個數(shù)N2測試樣本1錯誤率Η2測試樣本2判錯個數(shù)N3測試樣本2錯誤率Η30.50.51616%823%8127%0.250.751515%514.3%4214%0.10.91212%38.5%5317.7%由表可知:對于訓(xùn)練樣本,當(dāng)女生先驗概率為0.1時,判別錯誤率最?。粚τ跍y試樣本,當(dāng)女生先驗概率為0.1時,測試樣本1判別錯誤率最??;為0.25時,測試樣本2判別錯誤率最??;故可推測用最大似然估計對只考慮單特征的錯誤率進(jìn)行計算時,先驗概率越高,被判別的錯誤率越??;且所選

7、取的特征對錯誤率也有一定影響,其影響取決于訓(xùn)練樣本數(shù)據(jù)與測試樣本數(shù)據(jù)的特征差異。(二)、實驗二1、原理正態(tài)分布的監(jiān)督參數(shù)估計:樣品所屬的類別及類條件總體概率密度函數(shù)的形式為已知,而表征概率密度函數(shù)的某些參數(shù)是未知的。本實驗符合上述條件且在正態(tài)分布假設(shè)下估計分布密度參數(shù)故使用正態(tài)分布的監(jiān)督參數(shù)估計(1)、對于多元正態(tài)分別,其最大似然估計的結(jié)果為:(2)、最小錯誤率Bayes分類器A)、判別函數(shù):a.假設(shè)身高體重不相關(guān)令協(xié)方差矩陣次對角元素為零,判別函數(shù)可簡化為:其中,,b.假設(shè)身高體重相關(guān)判別函數(shù)可簡化為

8、:其中,,B)決策規(guī)則:2、具體步驟:a.算出各類別特征值的均值b.求出特征值的協(xié)方差矩陣c.將第二步所得矩陣代入判別函數(shù)、d.將待測試樣本集數(shù)據(jù)依次代入—,若—>0,則判斷其為第一類,反之為第二類。3、程序流程圖NY最大似然法求出均值與協(xié)方差分別代入判別函數(shù)確定特征及先驗概率第一類第二類4、實驗結(jié)果及分析A)假設(shè)身高與體重相關(guān)(以訓(xùn)練樣本建立判別函數(shù))表3.身高和體重相關(guān)情況下男女判錯統(tǒng)計表女生先驗概率P(1)男生先驗概率P(2)訓(xùn)練樣本

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。