單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測

單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測

ID:37046724

大小:4.74 MB

頁數(shù):72頁

時(shí)間:2019-05-17

單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測_第1頁
單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測_第2頁
單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測_第3頁
單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測_第4頁
單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測_第5頁
資源描述:

《單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、碩士學(xué)位論文單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測作者姓名黃婧瑩學(xué)科專業(yè)計(jì)算機(jī)科學(xué)與技術(shù)指導(dǎo)教師蔡宏民教授所在學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院論文提交日期2018年4月GenotypecallingandSNPdetectionforsingle-cellDNAsequencingdataADissertationSubmittedfortheDegreeofMasterCandidate:HuangJingyingSupervisor:Prof.CaiHongminSouthChinaUniversityofTechnologyGuangzhou,China分

2、類號:TP3學(xué)校代號:10561學(xué)號:201520130639華南理工大學(xué)碩士學(xué)位論文單細(xì)胞DNA測序數(shù)據(jù)的基因型和SNP檢測作者姓名:黃婧瑩指導(dǎo)教師姓名、職稱:蔡宏民教授申請學(xué)位級別:工學(xué)碩士學(xué)科專業(yè)名稱:計(jì)算機(jī)科學(xué)與技術(shù)研究方向:數(shù)據(jù)挖掘論文提交日期:2018年4月20日論文答辯日期:2018年5月31日學(xué)位授予單位:華南理工大學(xué)學(xué)位授予日期:年月日答辯委員會(huì)成員:主席:俞鶴偉教授委員:趙躍龍教授蔡宏民教授何克晶教授馬千里副教授華南理工大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研宄成果。除了文中

3、特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研宂做出重要貢獻(xiàn)的個(gè)人和集體,均己在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法律后果由本人承擔(dān)。作者簽名J:日:襲良日期:年月1學(xué)位論文版權(quán)使用授權(quán)書S本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,P:研宄生在校攻讀學(xué)位期間論文工作的知識(shí)產(chǎn)權(quán)單位屬華南理工大學(xué)。學(xué)校有權(quán)保存并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許學(xué)位論文被査閱(除在保密期內(nèi)的保密論文外);學(xué)??梢怨紝W(xué)位論文的全部或部分內(nèi)容,可以允許采

4、用影印、縮印或其它復(fù)制手段保存、匯編學(xué)位論文一。本人電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相致。本學(xué)位論文屬于:□保密,(校保密委員會(huì)審定為涉密學(xué)位時(shí)間:年月日)___于年月日解密后適用本授權(quán)書。___Ef不保密同意在校園網(wǎng)上發(fā)布,,供校內(nèi)師生和與學(xué)校有共享協(xié)議的單位瀏覽;同意將本人學(xué)位論文提交中國學(xué)術(shù)期刊(光盤版)電子雜志社全文出版和編入CNKI《中國知識(shí)資源總庫》,傳播學(xué)位論文的全部或部分內(nèi)容。“”V(請?jiān)谝陨舷鄳?yīng)方框內(nèi)打)作者簽名:查日期:2018年5月29日指導(dǎo)教師簽名:日期:2018年5月29曰作者聯(lián)系電

5、話:電子郵箱:聯(lián)系地址(含郵編):摘要單核苷酸多態(tài)性主要是指在基因組水平上由單個(gè)核苷酸的變異引起的DNA序列多態(tài)性,在人類可遺傳的變異中扮演了重要的角色。傳統(tǒng)的高通量測序技術(shù)是同時(shí)對多個(gè)細(xì)胞進(jìn)行測序,該測序技術(shù)忽略了細(xì)胞與細(xì)胞之間的異質(zhì)性,最終的測序結(jié)果反映的是多個(gè)細(xì)胞的平均值。隨著單細(xì)胞測序技術(shù)的引入,檢測單個(gè)細(xì)胞內(nèi)部的單核苷酸變異成為可能,然而由于單細(xì)胞測序數(shù)據(jù)中的噪音以及低覆蓋率等因素,使得精確地識(shí)別基因型和單核苷酸多態(tài)性仍具有挑戰(zhàn)性。基于此,本文主要以單細(xì)胞測序數(shù)據(jù)為研究對象,建立了基因型和單核苷酸多態(tài)性的檢測模型。首先,本文詳細(xì)地介紹了

6、單核苷酸多態(tài)性的分析流程。該分析流程由數(shù)據(jù)預(yù)處理、基因型和單核苷酸多態(tài)性識(shí)別兩個(gè)大模塊組成。單核苷酸多態(tài)性檢測的精確度與測序誤差有著密切的聯(lián)系,此誤差是由于測序過程中需要對單細(xì)胞測序數(shù)據(jù)進(jìn)行擴(kuò)增而引入的。為了提高單核苷酸多態(tài)性檢測的精確度,還需要對測序數(shù)據(jù)進(jìn)行質(zhì)控。然后,本文對單細(xì)胞測序數(shù)據(jù)的測序誤差進(jìn)行了分析,并基于單細(xì)胞測序數(shù)據(jù)的特性,提出了基因型和單核苷酸多態(tài)性的檢測模型。該模型使用了高斯分布對測序誤差進(jìn)行建模,同時(shí)在該模型中引入堿基被測錯(cuò)的概率和短序列比對錯(cuò)誤的概率,并使用動(dòng)態(tài)規(guī)劃方法對模型求解。綜上所述,本文的主要?jiǎng)?chuàng)新點(diǎn)在:1)整個(gè)分析流程中誤差

7、來源于兩點(diǎn),即堿基被測錯(cuò)的概率和短序列比對錯(cuò)誤的概率,常見的方法中只考慮了堿基被測錯(cuò)的概率,本文將這兩種錯(cuò)誤率同時(shí)融入模型之中;2)對單細(xì)胞測序數(shù)據(jù)的測序誤差進(jìn)行了分析,并基于此提出識(shí)別基因型和單核苷酸多態(tài)性的模型。為了驗(yàn)證本文方法檢測效果,本文首先基于組織測序數(shù)據(jù)構(gòu)建了驗(yàn)證數(shù)據(jù)集,然后以該驗(yàn)證數(shù)據(jù)集作為標(biāo)準(zhǔn)檢測結(jié)果,將本文方法和其他方法對檢測到的真實(shí)單核苷酸變異數(shù)、準(zhǔn)確度、轉(zhuǎn)換變異偏向性進(jìn)行比較。結(jié)果表明,在不同質(zhì)量分?jǐn)?shù)的情況下,本文方法檢測到的真實(shí)單核苷酸變異數(shù)和準(zhǔn)確度相對于其他方法有一定的提升,且轉(zhuǎn)換變異偏向性略微地變好。實(shí)驗(yàn)研究表明,本文方法能夠檢

8、測出更多發(fā)生變異的核苷酸位點(diǎn),有著一定的研究成效。關(guān)鍵詞:單核苷酸

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。