基于遺傳優(yōu)化獲取微陣列最佳分類規(guī)則

基于遺傳優(yōu)化獲取微陣列最佳分類規(guī)則

ID:21878182

大?。?0.00 KB

頁(yè)數(shù):8頁(yè)

時(shí)間:2018-10-25

基于遺傳優(yōu)化獲取微陣列最佳分類規(guī)則_第1頁(yè)
基于遺傳優(yōu)化獲取微陣列最佳分類規(guī)則_第2頁(yè)
基于遺傳優(yōu)化獲取微陣列最佳分類規(guī)則_第3頁(yè)
基于遺傳優(yōu)化獲取微陣列最佳分類規(guī)則_第4頁(yè)
基于遺傳優(yōu)化獲取微陣列最佳分類規(guī)則_第5頁(yè)
資源描述:

《基于遺傳優(yōu)化獲取微陣列最佳分類規(guī)則》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、基于遺傳優(yōu)化獲取微陣列最佳分類規(guī)則遺傳編程(GP)提出一種最優(yōu)規(guī)則遺傳算法(BRGA)對(duì)分類規(guī)則進(jìn)行優(yōu)化的方法,獲取最佳分類規(guī)則集,此算法可以調(diào)整分類器模型的相關(guān)參數(shù),在適當(dāng)增加迭代基礎(chǔ)上大幅提高分類的精確度,具有相當(dāng)?shù)撵`活性和可理解性.利用6個(gè)基因數(shù)據(jù)集檢驗(yàn)了算法的性能.仿真結(jié)果表明,本文提出的算法與其他文獻(xiàn)的方法相比,在具有較高分類精確度和穩(wěn)定性前提下大幅降低了計(jì)算復(fù)雜度及冗余.    關(guān)鍵詞:最優(yōu)規(guī)則遺傳算法;微陣列;遺傳編程;分類規(guī)則;計(jì)算復(fù)雜度  :TP391:A  生物醫(yī)學(xué)研究表明,人類大多數(shù)疾

2、病的發(fā)病機(jī)制,比如癌癥,從根本上來說都和基因息息相關(guān).微陣列數(shù)據(jù)是將樣本實(shí)驗(yàn)形成的影像轉(zhuǎn)為基因表達(dá)矩陣,矩陣行表示基因,列表示類別樣本,矩陣中的元素描述不同基因在不同樣本的表達(dá)水平.  由于微陣列芯片技術(shù)[1]獲得的基因數(shù)據(jù)數(shù)量遠(yuǎn)大于樣本數(shù)量,隨著維數(shù)的增加,最大的障礙則是在高維特征空間運(yùn)算時(shí)存在的“維數(shù)災(zāi)難”.微陣列大量基因數(shù)據(jù)僅為樣本分類提供了少數(shù)有分類意義的、具有明顯特征的基因.因此,在樣本分類之前,選擇特征基因是至關(guān)重要的,這直接影響到之后生成的分類器性能.微陣列分類作為生物指標(biāo)的探索成為生物信

3、息學(xué)一個(gè)重要的課題,事實(shí)上,由于存在更多的癌癥類型和潛在的癌癥子類,如果展開腫瘤分類問題到多重腫瘤類別,數(shù)據(jù)集包含更多的類別和非常少量的樣本,問題將變得更具有挑戰(zhàn)性.  一些研究報(bào)告指出,在基因選擇部分使用遺傳算法能改進(jìn)微陣列數(shù)據(jù)的分類性能[1-2],因此,遺傳算法已廣泛用于解決包括數(shù)據(jù)分類的各種難題[3-4].本文提出一種最優(yōu)規(guī)則遺傳算法(BestRuleGeicAlgorithm,BRGA),選用一種基于遺傳優(yōu)化的分類算法生成分類規(guī)則,用二進(jìn)制向量表示分類規(guī)則,初始化規(guī)則集,設(shè)定相應(yīng)的適應(yīng)度及

4、初始種群的規(guī)模,通過變異產(chǎn)生一定數(shù)量的最優(yōu)分類規(guī)則.通過實(shí)驗(yàn),使用6個(gè)基因表達(dá)數(shù)據(jù)集來驗(yàn)證算法的性能.  微陣列數(shù)據(jù)分類技術(shù)通常包含2部分內(nèi)容:1)基因選擇;2)構(gòu)建分類器模型.文獻(xiàn)[5]在基因選擇部分使用排列值計(jì)分RBS算法,很好地解釋了基因之間的相關(guān)性,大幅降低基因矩陣維度,在一定程度上減少了計(jì)算復(fù)雜性;在構(gòu)建分類器部分提出了LCR方法,可以用很少的基因構(gòu)造形成分類規(guī)則,提高了算法的可理解性.但分類規(guī)則的形成過程仍存在很多不足,如分類器模型中規(guī)則形成框架過于縝密,容易導(dǎo)致過擬合,產(chǎn)生龐大規(guī)則集的迭代過程相

5、當(dāng)繁瑣,并產(chǎn)生大量冗余的規(guī)則,導(dǎo)致計(jì)算復(fù)雜度較高且算法收斂速度較低.分類器的構(gòu)建則是整個(gè)技術(shù)的核心所在,傳統(tǒng)的微陣列分類方法有:加權(quán)投票()[8],費(fèi)舍爾線性判別分析(LDA)[9],人工神經(jīng)X絡(luò)(ANN)[10],遺傳規(guī)劃(GP)[11],最小二乘邏輯回歸[12]和樸素貝葉斯方法[13]等.由于它們僅僅聚焦于分類性能,而不能進(jìn)一步提供任何醫(yī)學(xué)和生物學(xué)依據(jù),導(dǎo)致這些分類算法往往產(chǎn)生僵硬的分類系統(tǒng),存在穩(wěn)定性弱和開銷大的特征,缺乏可擴(kuò)展性.決策樹算法[14]和隨機(jī)森林算法

6、[15]基于決策規(guī)則產(chǎn)生分類器模型,此類算法獲得的分類規(guī)則在某種意義上包含了生物體基因之間的相關(guān)性,但如果訓(xùn)練樣本存在小的差異會(huì)導(dǎo)致決策樹結(jié)構(gòu)產(chǎn)生大的變化,致使分類器缺乏穩(wěn)定性,這些分類方法仍然存在很大的局限性.  1BRGA方法的基本思想  BRGA算法是在遺傳優(yōu)化的基礎(chǔ)上,將分類規(guī)則集作為種群,使用二進(jìn)制串表示其中任意一條分類規(guī)則,計(jì)算對(duì)應(yīng)于基因?qū)傩缘谋容^關(guān)系的分類規(guī)則適應(yīng)度值,經(jīng)過若干代的繁殖過程,包括選擇、交叉和變異運(yùn)算,反復(fù)迭代優(yōu)化,獲取具有較高適應(yīng)度的最佳分類規(guī)則.  4結(jié)論  本文提出的

7、BRGA算法很好地解決了用微陣列基因表達(dá)值構(gòu)建分類決策規(guī)則普遍速度慢的難題,通過調(diào)整適合規(guī)則的適應(yīng)度值及相關(guān)參數(shù)對(duì)初始規(guī)則集進(jìn)行優(yōu)化,該算法能很快收斂于最優(yōu)分類規(guī)則集.采用6個(gè)數(shù)據(jù)集驗(yàn)證了該算法的性能,實(shí)驗(yàn)結(jié)果表明,BRGA算法具有較高的精確度和極少的分類運(yùn)算耗時(shí)(CPUtime).當(dāng)然,由于實(shí)驗(yàn)條件和生物學(xué)發(fā)展的局限性,該算法有待進(jìn)一步提高和完善.  遺傳編程(GP)提出一種最優(yōu)規(guī)則遺傳算法(BRGA)對(duì)分類規(guī)則進(jìn)行優(yōu)化的方法,獲取最佳分類規(guī)則集,此算法可以調(diào)整分類器模型的相關(guān)參數(shù),在適當(dāng)增加迭代基礎(chǔ)上大

8、幅提高分類的精確度,具有相當(dāng)?shù)撵`活性和可理解性.利用6個(gè)基因數(shù)據(jù)集檢驗(yàn)了算法的性能.仿真結(jié)果表明,本文提出的算法與其他文獻(xiàn)的方法相比,在具有較高分類精確度和穩(wěn)定性前提下大幅降低了計(jì)算復(fù)雜度及冗余.    關(guān)鍵詞:最優(yōu)規(guī)則遺傳算法;微陣列;遺傳編程;分類規(guī)則;計(jì)算復(fù)雜度 ?。篢P391:A  生物醫(yī)學(xué)研究表明,人類大多數(shù)疾病的發(fā)病機(jī)制,比如癌癥,從根本上來說都和基因息息相關(guān).微陣列數(shù)

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。