資源描述:
《用身高和體重數據進行性別分類的實驗報告》由會員上傳分享,免費在線閱讀,更多相關內容在行業(yè)資料-天天文庫。
1、----------專業(yè)最好文檔,專業(yè)為你服務,急你所急,供你所需-------------文檔下載最佳的地方用身高和體重數據進行性別分類的實驗報告一、基本要求用FAMALE.TXT和MALE.TXT的數據作為訓練樣本集,建立Bayes分類器,用測試樣本數據對該分類器進行測試。調整特征、分類器等方面的一些因素,考察它們對分類器性能的影響,從而加深對所學內容的理解和感性認識。二、具體做法(1)應用兩個特征進行實驗:同時采用身高和體重數據作為特征,分別假設二者相關或不相關,在正態(tài)分布假設下估計概率密度,建立最小錯誤率Bayes分類器,寫出得到的決策規(guī)則,將該分類器應用到訓練/測試樣本
2、,考察訓練/測試錯誤情況。比較相關假設和不相關假設下結果的差異。在分類器設計時可以考察采用不同先驗概率(如0.5vs.0.5,0.75vs.0.25,0.9vs.0.1等)進行實驗,考察對決策和錯誤率的影響。(2)自行給出一個決策表,采用最小風險的Bayes決策重復上面的實驗。三、原理簡述及程序框圖A.正態(tài)分布的監(jiān)督參數估計監(jiān)督參數估計:樣品所屬的類別及類條件總體概率密度函數的形式為已知,而表征概率密度函數的某些參數是未知的。本實驗符合上述條件且在正態(tài)分布假設下估計分布密度參數故使用正態(tài)分布的監(jiān)督參數估計對于多元正態(tài)分別,其最大似然估計的結果為:----------專業(yè)最好文檔,
3、專業(yè)為你服務,急你所急,供你所需-------------文檔下載最佳的地方----------專業(yè)最好文檔,專業(yè)為你服務,急你所急,供你所需-------------文檔下載最佳的地方A.最小錯誤率Bayes分類器在多元正態(tài)模型下的最小錯誤率角度來分析Bayes分類器(1)假設身高與體重不相關令協方差矩陣次對角元素為零判別函數可簡化為其中,具體算法步驟如下:第一步將訓練樣本集數據轉為矩陣FA,MA。第二步分別對FA,MA求取協方差,令協方差矩陣次對角元素為零,平均值并輸入先驗概率第三步將第二步所得數值代入判別函數表達式得。第四步將待測樣本集數據轉為矩陣T,將T中數值依次代,若,
4、則判斷其為第一類,反之,第二類。(2)假設身高與體重相關----------專業(yè)最好文檔,專業(yè)為你服務,急你所急,供你所需-------------文檔下載最佳的地方----------專業(yè)最好文檔,專業(yè)為你服務,急你所急,供你所需-------------文檔下載最佳的地方判別函數可簡化為其中,具體算法步驟如下:第一步將訓練樣本集數據轉為矩陣FA,MA。第二步分別對FA,MA求取協方差平均值并輸入先驗概率第三步將第二步所得數值代入判別函數表達式得。第四步將待測樣本集數據轉為矩陣T,將T中數值依次代,若,則判斷其為第一類,反之,第二類。A.最小風險Bayes分類器(1)在已知先驗
5、概率和類條件概率密度,j=1,…c及給出帶識別的x的情況下,根據Bayes公式計算后驗概率:----------專業(yè)最好文檔,專業(yè)為你服務,急你所急,供你所需-------------文檔下載最佳的地方----------專業(yè)最好文檔,專業(yè)為你服務,急你所急,供你所需-------------文檔下載最佳的地方(2)利用后驗概率及決策表,計算條件風險(3),就是最小風險Bayes決策。其中(1)中先驗概率根據自行輸入,類條件概率密度=,本實驗為二維二類,故d=2,(2)中決策表自行輸入。一、實驗結果及分析總結(1)用最小錯誤率Bayes決策假設身高與體重相關(以訓練樣本建立判別函
6、數)性別為女生的先驗概率P(1)性別為男生的先驗概率P(2)訓練樣本判錯的個數N1訓練樣本的錯誤率Η1測試樣本判錯的個數N2測試樣本的錯誤率Η2----------專業(yè)最好文檔,專業(yè)為你服務,急你所急,供你所需-------------文檔下載最佳的地方----------專業(yè)最好文檔,專業(yè)為你服務,急你所急,供你所需-------------文檔下載最佳的地方0.10.92424%165.33%0.17(1/6)0.83(5/6)1919%144.67%0.40.61313%248%0.50.51212%3210.67%0.750.251414%6020.00%由表可知:對于訓
7、練樣本,當女生先驗概率為0.5時,判別錯誤率最小對于測試樣本,當女生先驗概率為1/6時,判別錯誤率最小故可推測用最小錯誤率Bayes決策假設身高與體重相關當女生先驗概率等于待測樣本中女生樣本占待測樣本的概率時,錯誤率最小,且越遠離此概率,錯誤率越大。最佳決策對于訓練樣本,當女生先驗概率為0.5對于測試樣本,當女生先驗概率為1/6假設身高與體重不相關(以訓練樣本建立判別函數)性別為女生的先驗概率P(1)性別為男生的先驗概率P(2)訓練樣本判錯的個數N1訓練樣本的錯誤率Η1測試樣本判