資源描述:
《多示例多標簽學習在基因功能注釋中的應用》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、學校代號:10532學密號:Slll02022級:普通湖南大學碩士學位論文多示例多標簽的應用學習在基因功能注途室握童目期;2Q!壘生5旦!壘目途室筌整旦期;2Q!壘生5旦2窆目釋中Applicationofmulti—instancemulti—labelongenefunctionannotationbyLIY}unB.S.(HunanUniversityofArtsandScience)20l0AthesissubmittedinpanialsatisfactionoftheRequirementsforthe
2、degreeofMasterofEngineeringInformationandCommunicationEngineeringintheGraduateSchoolofHunanUniVersitySupervisorProfessorLIAOBoMay,2叭4湖南大學學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導師的指導下獨立進行研究所取得的研究成果。除了文中特別加以標注引用的內容外,本論文不包含任何其他個人或集體已經發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標明
3、。本人完全意識到本聲明的法律后果由本人承擔。作者簽名:礁日期:訟緲年/月/日學位論文版權使用授權書本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,同意學校保留并向國家有關部門或機構送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權湖南大學可以將本學位論文的全部或部分內容編入有關數據庫進行檢索,可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。本學位論文屬于1、保密口,在年解密后適用本授權書。2、不保密團。(請在以上相應方框內打“√”)作者簽名:導師簽名:存堙1日期:如,侈年鄉(xiāng)月占日日期:勱l甲年
4、參月占日多示例多標簽學習在基因功能注釋中的應用摘要在后基因組時代,最主要的挑戰(zhàn)是基因組注釋。作為基因組注釋的重要研究部分,基因功能注釋有著舉足輕重的地位。為人類更好的認識基因,探索生命的本源提供必要的依據。人類基因組測序工程產生了大量的全基因組數據,這些數據為基因功能注釋課題的研究提供了豐富的生物學信息。然而,從大量的信息中獲取有用的知識,人工的方法已經不能勝任,需借助計算的方法進行機器學習。本文采用多示例多標簽的學習方法對該任務進行研究,主要的研究工作如下:首先,本文從基因表達模式的角度對基因功能進行預測,細致地
5、分析研究了基因功能注釋數據庫中基因功能之間的關系及其推導過程。針對基因功能注釋數據庫中基因與功能之間多對多映射關系的特點,本文引入多示例多標簽學習框架,并對多示例多標簽學習框架進行研究分析。其次,針對多示例多標簽學習框架的退化策略會退去基因之間的相關性的問題,本文結合多示例學習框架與層次聚類算法,提出了多示例層次聚類算法。該算法以基因表達相關性為基礎,將擁有相同基因功能的基因的時序表達數據子集視為該基因功能的示例集合進行多示例構建。使用基因時序表達數據之間的皮爾森相關系數計算多示例之間的距離,并通過最大化各基因功能
6、類中所包含的基因之間的相關性進行聚類約束,使得基因之間的相關性能在聚類過程中得到很好的保持。最后,為驗證算法的有效性,本文在釀酒酵母的四個基因時序表達譜中進行實驗,先使用多示例層次聚類算法將多示例多標簽任務退化成單示例多標簽任務,再采用多標簽支持向量機或多標簽K近鄰算法進行求解。實驗表明該算法能在多示例多標簽學習框架的退化過程中很好的保持著基因之間的相關性,并擁有著良好的性能。關鍵詞:基因時序表達;基因功能注釋;機器學習;多示例多標簽II碩士學位論文AbstractInthepostgenomeera,themai
7、nchallengeisgenomeannotation.Asanimportantpartofthegenomeannotation,genefunctionalannotationplaysadecisiVerole.Tounderstandthegenefbrhumanbetter,itproVidesthenecessarybasisf-orexploringtheoriginof1ifb.Thesequencingofthehumangenomeprojecttoproduceawholegenomeda
8、ta,thesedataproVideabundantbiologicalinformationforthestudyofgenefunctionannotation.However,toobtainusefulknowledgefromalargeamountofdata,machinelearningisbetterthanthearti矗cialmet