基于配對信息的dna從頭測序組裝算法研究

基于配對信息的dna從頭測序組裝算法研究

ID:27064295

大?。?.94 MB

頁數:60頁

時間:2018-11-30

基于配對信息的dna從頭測序組裝算法研究_第1頁
基于配對信息的dna從頭測序組裝算法研究_第2頁
基于配對信息的dna從頭測序組裝算法研究_第3頁
基于配對信息的dna從頭測序組裝算法研究_第4頁
基于配對信息的dna從頭測序組裝算法研究_第5頁
資源描述:

《基于配對信息的dna從頭測序組裝算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。

1、碩士學位論文基于配對信息的DNA從頭測序組裝算法研究ALGORITHMRESEARCHOFDNADENOVOASSEMBLYBASEDONMATE-PAIR趙瑋哈爾濱工業(yè)大學2011年6月中圖分類號:TP319學校代碼:10213 UDC:621.3密級:公開工學碩士學位論文基于配對信息的DNA從頭測序組裝算法研究碩士研究生:趙瑋導師:權光日教授申請學位:工學碩士學科:計算機科學與技術所在單位:計算機科學與技術學院答辯日期:2011年6月授予學位單位:哈爾濱工業(yè)大學ClassifiedIndex:TP319 U.D.C:621

2、.3DissertationfortheMasterDegreeinEngineeringALGORITHMRESEARCHOFDNADENOVOASSEMBLYBASEDONMATE-PAIRCandidate:ZhaoWeiSupervisor:Prof.QuanGuangriAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechn

3、ologyDateofDefence:June,2011Degree-Conferring-Institution:HarbinInstituteofTechnology哈爾濱工業(yè)大學工學碩士學位論文摘要進入二十一世紀以來,新一代測序技術的出現使得到全基因組的拼接組裝算法備受關注。以Roche公司454,Illumina公司Solexa,ABI公司SOLiD為代表的新一代測序技術產生的數據存在測序片段短、錯誤率高等缺點,使得傳統的拼接組裝軟件不再適用。但是由于其高通量、低成本的優(yōu)點,尤其在細菌等微生物從頭測序中取得的成功極大的

4、鼓舞了人們對新一代測序技術的研究熱情。全基因組組裝算法研究是全基因組拼接組裝算法的一個重要環(huán)節(jié),研究并開發(fā)可運行在個人計算機上的獨立的組裝算法是非常有必要的。面向新一代測序數據的全基因組拼接組裝算法分為兩個重要的部分,第一個部分是將新一代測序技術產生的DNA片段拼接成contig的過程,稱之為拼接階段。第二個部分是將拼接階段產生的contigs組裝成scaffold的過程,稱之為組裝階段。本文所要研究的就是全基因組的從頭測序組裝階段的算法,為達到這個目標,本文在研究新一代測序技術原理的基礎上,提出了快速篩選配對信息的算法與co

5、ntig組裝算法。通過配對信息庫的構造過程,得到了所有contig上面所存在的配對信息,設計了兩個映射結構獲得任意兩條contig之間的關聯關系,提出了獨特的數據結構來保存任意兩條contig之間的配對信息數目,最終完成了從頭測序組裝算法的設計與實現。提出了快速篩選有效配對信息的算法以及contig組裝算法,該算法是可運行在個人計算機上的串行算法。設計了節(jié)省內存的數據結構,提高了算法的速度。充分利用了測序數據的生物學特征,在不考慮contig之間有重疊的情況下成功組裝了72%的contig。關鍵詞:DNA序列;從頭測序;全基因

6、組組裝;配對信息-I-哈爾濱工業(yè)大學工學碩士學位論文AbstractAsenteringintothe21stcentury,theemergenceofthenext-generationsequencing platformsledtoresurgencetheresearchinthewhole-genomeassemblyalgorithmsand software.DNAsequencingdatafromtheRoche454,IlluminaSolexa,andABISOLiD platformswhichrep

7、resentthenext-generationsequencingplatformstypicallypresent shortreadlengths,higherrorrateandothershortcomings.Theseshortcomingsleadto thetraditionalgenomeassemblyalgorithmsandsoftwarenolongerapplicable.However, duetoitshighthroughput,lowcost,andespeciallyitssuccess

8、inthedenovo sequencingofthebacteriawhichgreatencouragepeople’spassionoftheresearchtothe next-generationsequencingtechnology.Scaffoldingalg

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯系客服處理。