模式識別——用身高和或體重數(shù)據(jù)進行性別分類

ID：15854309

大小：405.00 KB

頁數(shù)：12頁

時間：2018-08-06

資源描述：

《模式識別——用身高和或體重數(shù)據(jù)進行性別分類》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、用身高和/或體重數(shù)據(jù)進行性別分類1、【實驗?zāi)康摹浚?）掌握最小錯誤率Bayes分類器的決策規(guī)則（2）掌握Parzen窗法（3）掌握Fisher線性判別方法（4）熟練運用matlab的相關(guān)知識。2、【實驗原理】（1）、最小錯誤率Bayes分類器的決策規(guī)則如果在特征空間中觀察到某一個（隨機）向量x=(x1,x2,…,xd)T，已知類別狀態(tài)的先驗概率為：和類別的條件概率密度為，根據(jù)Bayes公式得到狀態(tài)的后驗概率有：基本決策規(guī)則：如果，則，將x歸屬后驗概率最大的類別。（2）、掌握Parzen窗法對于被估計點X：其估計概率密度的基本公式，設(shè)區(qū)域RN是以hN為棱長的d維超立方體，則立方體的體積

2、為；選擇一個窗函數(shù)，落入該立方體的樣本數(shù)為，點x的概率密度:其中核函數(shù)：，滿足的條件：；。（3）、Fisher線性判別方法12Fisher線性判別分析的基本思想：通過尋找一個投影方向（線性變換，線性組合），將高維問題降低到一維問題來解決，并且要求變換后的一維數(shù)據(jù)具有如下性質(zhì)：同類樣本盡可能聚集在一起，不同類的樣本盡可能地遠(yuǎn)。Fisher線性判別分析，就是通過給定的訓(xùn)練數(shù)據(jù)，確定投影方向W和閾值y0，即確定線性判別函數(shù)，然后根據(jù)這個線性判別函數(shù)，對測試數(shù)據(jù)進行測試，得到測試數(shù)據(jù)的類別。線性判別函數(shù)的一般形式可表示成　　，其中根據(jù)Fisher選擇投影方向W的原則，即使原樣本向量在該方向上

3、的投影能兼顧類間分布盡可能分開，類內(nèi)樣本投影盡可能密集的要求，用以評價投影方向W的函數(shù)為：　　　　上面的公式是使用Fisher準(zhǔn)則求最佳法線向量的解，該式比較重要。另外，該式這種形式的運算，我們稱為線性變換，其中式一個向量，是的逆矩陣，如是d維，和都是d×d維，得到的也是一個d維的向量?！　∠蛄烤褪鞘笷isher準(zhǔn)則函數(shù)達極大值的解，也就是按Fisher準(zhǔn)則將d維X空間投影到一維Y空間的最佳投影方向，該向量的各分量值是對原d維特征向量求加權(quán)和的權(quán)值。以上討論了線性判別函數(shù)加權(quán)向量W的確定方法，并討論了使Fisher準(zhǔn)則函數(shù)極大的d維向量的計算方法，但是判別函數(shù)中的另一項尚未確定，一般

4、可采用以下幾種方法確定如　　　或者　　　　　或當(dāng)與已知時可用12　當(dāng)W0確定之后，則可按以下規(guī)則分類：　　　3、【實驗內(nèi)容及要求】（1）、實驗對象Datasetf1.TXT女生的身高、體重數(shù)據(jù)Datasetm1.TXT男生的身高、體重數(shù)據(jù)-----訓(xùn)練樣本集Dataset1.txt328個同學(xué)的身高、體重、性別數(shù)據(jù)Dataset2.txt124個同學(xué)的身高、體重、性別數(shù)據(jù)-----測試樣本集（2）基本要求：(1)用Datasetf1.TXT和Datasetm1.TXT的數(shù)據(jù)作為訓(xùn)練樣本集，建立Bayes分類器，用測試樣本數(shù)據(jù)對該分類器進行測試。調(diào)整特征、分類器等方面的一些因素，考察它

5、們對分類器性能的影響，從而加深對所學(xué)內(nèi)容的理解和感性認(rèn)識。(試驗直接設(shè)計線性分類器的方法，與基于概率密度估計的貝葉斯分離器進行比較)(2)試驗非參數(shù)估計，體會與參數(shù)估計在適用情況、估計結(jié)果方面的異同。4、【實驗結(jié)果與分析】（1）、Bayes分類器的實驗結(jié)果與分析A、對于Dataset1.txt328個同學(xué)的身高、體重、性別數(shù)據(jù)的測試樣本集：A1、當(dāng)先驗概率為：男0.5，女0.5時：12身高分類錯誤個數(shù)：15身高分類錯誤率為：12.10%體重分類錯誤個數(shù)：15體重分類錯誤率為：12.10%【實驗結(jié)果：】12A2、當(dāng)先驗概率為：男0.75，女0.25時：身高分類錯誤個數(shù)：19身高分類錯誤

6、率為：15.32%體重分類錯誤個數(shù)：14體重分類錯誤率為：11.29%B、對于Dataset2.txt124個同學(xué)的身高、體重、性別數(shù)據(jù)的測試樣本集：B1、當(dāng)先驗概率為：男0.5，女0.5時：身高分類錯誤個數(shù)：16身高分類錯誤率為：12.90%體重分類錯誤個數(shù)：21體重分類錯誤率為：16.94%12【實驗結(jié)果：】B2、當(dāng)先驗概率為：男0.75，女0.25時：身高分類錯誤個數(shù)：31身高分類錯誤率為：25.00%體重分類錯誤個數(shù)：35體重分類錯誤率為：28.23%12【結(jié)果分析：】Dataset1.txt樣本數(shù)據(jù)集中，男女先驗概率為（0.71vs0.29）；Dataset2.txt樣本數(shù)

7、據(jù)集中，男女先驗概率為（0.66vs0.34）。對比實驗結(jié)果，可以發(fā)現(xiàn)身高的分類錯誤率都小于體重的分類錯誤率，樣本集越大，各個特征對應(yīng)的分類錯誤率就越小。假設(shè)先驗概率為（0.5vs0.5）的分類錯誤率小于假設(shè)先驗概率為（0.75vs0.25）的分類集，就算假設(shè)的先驗概率與實際的很相近，可是結(jié)果不準(zhǔn)確。程序框圖12Bayes分類器源程序?qū)嶒灤a：clearall;loaddatasetf1.txt;loaddatasetm1.txt;%樣本的分析figure

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 12



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

模式識別——用身高和或體重數(shù)據(jù)進行性別分類

模式識別——用身高和或體重數(shù)據(jù)進行性別分類

相關(guān)文章

相關(guān)標(biāo)簽