基于加權(quán)策略的SVM多元分類器

ID：37975095

大?。?74.50 KB

頁數(shù)：21頁

時(shí)間：2019-06-04

資源描述：

《基于加權(quán)策略的SVM多元分類器》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、基于加權(quán)策略的SVM多元分類器華南理工大學(xué)信息網(wǎng)絡(luò)工程研究中心廣東省計(jì)算機(jī)網(wǎng)絡(luò)重點(diǎn)實(shí)驗(yàn)室曹鴻董守斌張凌全國搜索引擎與網(wǎng)上信息學(xué)術(shù)研討會(huì)目錄算法描述傳統(tǒng)一對(duì)多（OVA）方法加權(quán)閾值策略（OVA-WWT）系統(tǒng)模塊實(shí)驗(yàn)結(jié)果結(jié)論傳統(tǒng)OVA（One-Vs-All）方法：主要思路主要思路訓(xùn)練N個(gè)不同的二元分類器，第i個(gè)分類器用第i類中的訓(xùn)練樣本作為正的訓(xùn)練樣本，而將其他樣本作為負(fù)的訓(xùn)練樣本當(dāng)對(duì)一個(gè)新文檔進(jìn)行分類時(shí)，分別運(yùn)行N個(gè)二元分類器，選擇輸出相似度值最大的那個(gè)分類器的結(jié)果傳統(tǒng)一對(duì)多（OVA）方法：形式化描述給定個(gè)l訓(xùn)練樣例(,),…(,)，其中,i=1,…l,且是xi的類標(biāo)簽，

2、則第i個(gè)SVM分類器要解決下面的最優(yōu)化問題:用下面的k個(gè)決策方程計(jì)算x與k個(gè)類別的相似度：最終判定x隸屬于決策方程輸出相似度最高的那個(gè)類別：Classofx=閾值策略閾值策略：把一篇文檔歸屬到某些相關(guān)類別中的方法RCut、PCut和SCut傳統(tǒng)OVA使用的是RCut策略傳統(tǒng)一對(duì)多（OVA）方法：缺點(diǎn)1）比較文檔對(duì)N個(gè)類別的相似度，簡單地取相似度最大的那個(gè)類別，由于這N個(gè)相似度是由N個(gè)不同的分類器產(chǎn)生，簡單地取最大值作為閾值策略并不合適；2）對(duì)所有類別一視同仁，而實(shí)際上，有些類別屬于“弱勢(shì)類”，其類別信息容易被“強(qiáng)勢(shì)類”所淹沒，導(dǎo)致“弱勢(shì)類”文檔被誤分到“強(qiáng)勢(shì)類”中的不公

3、平現(xiàn)象。本文對(duì)OVA的改進(jìn)提出加權(quán)閾值策略(WeightedRCut:WRCut)通過給不同類別的相似度結(jié)果賦以一定的權(quán)重值后再進(jìn)行比較，實(shí)現(xiàn)“弱勢(shì)類”和“強(qiáng)勢(shì)類”之間的勢(shì)力均衡，以消除使用單一的RCut策略所造成的不公平現(xiàn)象目錄算法描述傳統(tǒng)一對(duì)多（OVA）方法加權(quán)閾值策略（OVA-WWT）系統(tǒng)模塊實(shí)驗(yàn)結(jié)果結(jié)論加權(quán)閾值策略（OVA-WWT）算法描述：先解SVM最優(yōu)化問題，用決策方程計(jì)算出文檔對(duì)N個(gè)類別的相似度，再對(duì)各類別運(yùn)用WRCut閾值策略，文檔x屬于加權(quán)相似度最大的類別Classofx=ai也可以通過對(duì)訓(xùn)練集的學(xué)習(xí)而得。目錄傳統(tǒng)一對(duì)多（OVA）方法加權(quán)閾值策略（OV

4、A-WWT）系統(tǒng)模塊實(shí)驗(yàn)結(jié)果結(jié)論系統(tǒng)模塊結(jié)構(gòu)目錄算法描述傳統(tǒng)一對(duì)多（OVA）方法加權(quán)閾值策略（OVA-WWT）系統(tǒng)模塊實(shí)驗(yàn)結(jié)果結(jié)論實(shí)驗(yàn)結(jié)果數(shù)據(jù)集：北京大學(xué)網(wǎng)絡(luò)實(shí)驗(yàn)室提供的CWT100G數(shù)據(jù)集之200M訓(xùn)練集（11個(gè)類別）模型：200M數(shù)據(jù)的2/3用于構(gòu)建分類器模型，剩余1/3作開放測(cè)試集進(jìn)行分類測(cè)試。SVM使用線性核函數(shù)。評(píng)測(cè)標(biāo)準(zhǔn)：微平均準(zhǔn)確率、宏平均準(zhǔn)確率、宏平均召回率、宏平均F1值和時(shí)間，其中時(shí)間是包括訓(xùn)練和分類的總時(shí)間實(shí)驗(yàn)結(jié)果1：分類器的比較(1)分類方法微平均準(zhǔn)確率（％）宏平均準(zhǔn)確率（％）宏平均召回率（％）宏平均F1（％）時(shí)間（s)SVMmultic64.352

5、7.1925.6526.401795.53SVMTorch44.3575.6135.9548.7325034.3RainbowSVM80.1376.9575.7376.3313205.5MSVMlight88.6490.7085.9988.311108.5實(shí)驗(yàn)結(jié)果1：分類器的比較(2)性能曲線圖時(shí)間柱狀圖實(shí)驗(yàn)2：閾值策略的比較（1）對(duì)WRCut中各類別的權(quán)重值，本文將訓(xùn)練集隨機(jī)劃分為訓(xùn)練-訓(xùn)練集(占3/4)和訓(xùn)練-測(cè)試集（占1/4），從經(jīng)驗(yàn)值出發(fā)，在反復(fù)訓(xùn)練的過程中自動(dòng)調(diào)整權(quán)重值。權(quán)重調(diào)整范圍為0.9~1.9，每個(gè)類的權(quán)重分別遞增0.1，當(dāng)權(quán)重的增加使得精度下降時(shí)，該權(quán)

6、重減0.1，取宏觀F1達(dá)到最大值時(shí)各類別所得權(quán)重，總訓(xùn)練時(shí)間為58.587秒，這個(gè)時(shí)間對(duì)總訓(xùn)練時(shí)間而言是可忽略的。實(shí)驗(yàn)2：閾值策略的比較（2）類別編號(hào)類別權(quán)重值01人文與藝術(shù)1.903商業(yè)與經(jīng)濟(jì)1.704娛樂與休閑1.905計(jì)算機(jī)與因特網(wǎng)1.907教育1.908各國風(fēng)情0.910自然科學(xué)0.911政府與政治1.912社會(huì)科學(xué)1.913醫(yī)療與健康1.914社會(huì)與文化1.1經(jīng)過學(xué)習(xí)得到的11個(gè)類別各自的權(quán)重值實(shí)驗(yàn)2：閾值策略的比較（3）RCut策略與WRCut策略精度比較曲線目錄算法描述傳統(tǒng)一對(duì)多（OVA）方法加權(quán)閾值策略（OVA-WWT）系統(tǒng)模塊實(shí)驗(yàn)結(jié)果結(jié)論結(jié)論本文提出了

7、一對(duì)多算法的改進(jìn)版本OVA-WWT算法基于OVA-WWT和SVMlight二元分類算法，實(shí)現(xiàn)了SVMlight的多元分類器MSVMlight。在CWT100G上進(jìn)行了一系列開放性實(shí)驗(yàn)，通過與多種分類器進(jìn)行性能比較，證明對(duì)CWT100G數(shù)據(jù)集而言，MSVMlight在準(zhǔn)確率和時(shí)間性能要優(yōu)于其他三種分類器。針對(duì)CWT100G數(shù)據(jù)集進(jìn)行閾值策略選擇實(shí)驗(yàn)，結(jié)果表明，OVA-WWT算法比OVA算法精度要高缺點(diǎn)：類別權(quán)重的訓(xùn)練需要花費(fèi)額外時(shí)間，但是對(duì)于大規(guī)模數(shù)據(jù)的訓(xùn)練和分類而言，以可忽略的時(shí)間換來精度的顯著提高是值得的謝謝大家！

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 21



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無此問題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

基于加權(quán)策略的SVM多元分類器

基于加權(quán)策略的SVM多元分類器

相關(guān)文章

相關(guān)標(biāo)簽