資源描述:
《生物序列的索引研究及其應用》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、生物序列的索引研究及其應用Researchandapplicationofindexonbiologicalsequences導邱伯仁師朱揚勇教授指導小組成員施伯樂教授顧寧教授汪衛(wèi)教授張亮教授d4拳疊;{f§j,,§‘l-9·f,●-薏_薯菩P目錄。摘要......................??..????...........??.....................................????..?...???..IABSTRACT..。.。。。.?.?.。....。。。。????.。.?????...?..。
2、.????。..??.??????.I第1章引言??????????????????????????????????。l1.1研究背景和意義?????????????????????????11.1.1生物信息學??????????????????????????.11.1.2生物序列相似性查詢?????????????????????21.2本文的主要工作????????????????????????。31.3文章結(jié)構(gòu)???????????????????????????.4第2章相關工作???????????????????.2.
3、1問題定義及描述????????????????????????一62.2研究進展????????????????????????????????.1O第3章BIoINDEX索引143.1索引的建立??????????????????????????143.2基于BIoINDEx的查詢算法????????????????????l53.3實驗結(jié)果及其分析????????????????????????。173.4本章小結(jié)???????????????????????????.19第4章SSQ』F算法????......????.....
4、.....??.??...?????.:!II4.1最優(yōu)過濾順序模型和過濾集大小估計???????????????。204.1.1最優(yōu)過濾順序模型???????????????????????204.1.2各過濾器的基本過濾原理???????????????????234.1.3過濾集大小的在線估計???????????????????。254.2SS0-MF算法實現(xiàn)策略???。??????????????????.3l4.3實驗結(jié)果及其分析???????????????????????334.3.1參數(shù)影響??????????????
5、???????????..344.3.2過濾水平?????????????????????????????????..354.3.3過濾代價和過濾準確度???????????????????。364.4本章小結(jié)???????????????????????????????????..38第5章轉(zhuǎn)錄調(diào)控序列數(shù)據(jù)挖掘系統(tǒng)????????????????????。?.395.1轉(zhuǎn)錄調(diào)控序列數(shù)據(jù)挖掘系統(tǒng)概述??????????????????39生物序列的索引研究及其應用5.2順式調(diào)控元件查詢工具?????????????????????.4l
6、5.3轉(zhuǎn)錄調(diào)控序列挖掘工具?????????????????????.425.3.1順式調(diào)控元件挖掘工具???????????????????..425.3.2轉(zhuǎn)錄因子挖掘工具?????????????????????..435.3本章小結(jié)????????????????????????????45第6章總結(jié)與未來研究工作??????...??????????????????.47參考文獻???????????????????????????????????.49攻讀碩士學位期間的工作成果???。致{射?????????????????
7、?.生物序列的索引研究及其應用捅要在生物領域研究中,在巨量生物數(shù)據(jù)庫中進行生物序列相似性查詢是一項經(jīng)常性的工作,在探索生物學知識和生命活動規(guī)律的過程中扮演著重要角色。然而在大型的長序列數(shù)據(jù)庫中用樸素的完全搜索方法來進行相似性查詢,其效率是非常低下的。因此,研究者開始研究各種優(yōu)化方式來提高查詢效率。查詢優(yōu)化的關鍵技術之一就是建立索引。索引結(jié)構(gòu)用一定的存儲空間作為代價換取查詢時的快速響應。良好的索引結(jié)構(gòu)能有效組織生物序列數(shù)據(jù),顯著提高檢索的速度。然而現(xiàn)有的方法存在一些問題,針對這些問題提出新的方法以提高查詢效率是當前研究的熱點。本文分析了當
8、前的生物序列相似性查詢的索引研究的現(xiàn)狀,針對現(xiàn)有查詢算法的不足,提出了新的基于索引的生物序列相似性查詢算法BioIndex方法和SSQ-MF算法,設計實現(xiàn)了轉(zhuǎn)錄調(diào)控序列數(shù)據(jù)挖掘系統(tǒng)ITREP。本文取得的主要