資源描述:
《有參轉(zhuǎn)錄組結(jié)題報告.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、單位+轉(zhuǎn)錄組分析網(wǎng)頁版結(jié)題報告2016/01/29目錄1項目信息1.1基本思想1.2實驗流程1.2.1樣本檢測1.2.2文庫構(gòu)建和上機(jī)測序1.3信息分析流程1.4樣品信息2數(shù)據(jù)過濾2.1原始數(shù)據(jù)2.2數(shù)據(jù)過濾統(tǒng)計2.3測序質(zhì)量分布2.4測序堿基分布3比對分析3.1比對率分析3.2基因區(qū)域分布3.3均一性分析3.4比對文件可視化4表達(dá)量分析4.1表達(dá)量估計4.1.1表達(dá)量分布統(tǒng)計4.1.2飽和度分析4.1.3樣品實驗的聚類4.2差異表達(dá)分析4.2.1差異表達(dá)分析統(tǒng)計結(jié)果4.2.2差異表達(dá)基因聚類圖4.2.3差異表達(dá)基因統(tǒng)計結(jié)果注釋5蛋白互作網(wǎng)絡(luò)6功能分析6.1GO功能分析6.1.1差異表達(dá)
2、基因的GO統(tǒng)計6.1.2GO富集分析6.2GO富集DAG圖6.3KEGG通路分析7可變剪接分析7.1可變剪切分析7.1.1可變剪切事件分類和數(shù)量統(tǒng)計7.1.2可變剪切事件結(jié)構(gòu)和表達(dá)量7.2新轉(zhuǎn)錄本預(yù)測8變異分析9附錄9.1參考文獻(xiàn)9.2軟件與方法說明9.3結(jié)果目錄1項目信息1.1基本思想安諾優(yōu)達(dá)轉(zhuǎn)錄組測序,基于Illumina測序平臺,通過研究某個物種在特定狀態(tài)或者特定時期下所有的mRNA,針對實際樣品信息采用靈活的差異分析策略可以找到生物體不同時期、不同組織或不同個體間差異表達(dá)的mRNA,再通過軟件進(jìn)行功能注釋,最終可以得到mRNA在生物體中參與生命活動的清晰生物信息圖譜。1.2實驗流
3、程1.2.1樣本檢測安諾優(yōu)達(dá)對總RNA的樣本檢測包括以下3種方法:(1)1%的瓊脂糖電泳檢測RNA樣品是否有降解以及雜質(zhì);(2)凱奧K5500分光光度計檢測樣品純度(凱奧,北京);(3)安捷倫2100RNANano6000AssayKit(AgilentTechnologies,CA,USA)檢測RNA樣品的完整性和濃度。1.2.2文庫構(gòu)建和上機(jī)測序總RNA樣本檢測合格后,對于真核生物,用帶有Oligo(dT)的磁珠富集mRNA,對于原核生物,用試劑盒去除rRNA,向得到的mRNA中加入FragmentationBuffer使其片斷成為短片段,再以片斷后的mRNA為模板,用六堿基隨機(jī)引物
4、合成cDNA第一鏈,并加入緩沖液、dNTPs、RNaseH和DNAPolymeraseI合成cDNA第二鏈,經(jīng)過QIAQuickPCR試劑盒純化并加EB緩沖液洗脫。洗脫純化后的雙鏈cDNA再進(jìn)行末端修復(fù)、加堿基A、加測序接頭處理,然后經(jīng)瓊脂糖凝膠電泳回收目的大小片段并進(jìn)行PCR擴(kuò)增,從而完成整個文庫制備工作。構(gòu)建好的文庫用IlluminaHiSeq2500進(jìn)行測序。測序策略為PE125。其實驗流程如下:圖1實驗流程圖1.3信息分析流程HiSeq測序所得原始下機(jī)序列(RawReads),通過去低質(zhì)量序列、去接頭污染等過程完成數(shù)據(jù)處理得到高質(zhì)量的序列(CleanReads),后續(xù)所有分析都是
5、基于CleanReads。安諾優(yōu)達(dá)轉(zhuǎn)錄組測序信息分析流程主要分為三部分:測序數(shù)據(jù)質(zhì)控、數(shù)據(jù)比對分析和轉(zhuǎn)錄組深層分析。其中,測序數(shù)據(jù)質(zhì)控包括過濾測序所得序列、評估測序數(shù)據(jù)質(zhì)量以及計算序列長度分布等;數(shù)據(jù)比對分析主要是針對比對到基因組中的序列,根據(jù)不同的基因組注釋信息依次進(jìn)行分類和特征分析,并計算相應(yīng)的表達(dá)量;轉(zhuǎn)錄組深層分析包括差異表達(dá)分析、可變剪接分析、新轉(zhuǎn)錄本預(yù)測和變異分析等其他個性化分析。具體的信息分析流程圖如下:圖2信息分析流程圖如項目僅有一個樣品,無法進(jìn)行虛線所示的分析內(nèi)容。1.4樣品信息本項目共6個樣本,樣品信息示例如下:表1樣品信息SampleS1GroupG1Descript
6、ion...2數(shù)據(jù)過濾2.1原始數(shù)據(jù)Illumina高通量測序結(jié)果最初以原始圖像數(shù)據(jù)文件存在,經(jīng)CASAVA軟件進(jìn)行堿基識別(BaseCalling)后轉(zhuǎn)化為原始測序序列(SequencedReads),我們稱之為RawData,其結(jié)果以FASTQ(簡稱為fq)文件格式存儲。FASTQ文件包含每條測序序列(Read)的名稱、堿基序列以及其對應(yīng)的測序質(zhì)量信息。在FASTQ格式文件中,每個堿基對應(yīng)一個堿基質(zhì)量字符,每個堿基質(zhì)量字符對應(yīng)的ASCII碼值減去33(Sanger質(zhì)量值體系),即為該堿基的測序質(zhì)量得分。不同Score代表不同的堿基測序錯誤率,如Score值為20和30分別表示堿基測序
7、錯誤率為1%和0.1%。其中FASTQ格式示例如下:圖3FASTQ文件格式示例(1)第一行以“@”開頭,隨后為Illumina測序標(biāo)識別符(SequenceIdentifiers)和描述文字(選擇性部分);(2)第二行是堿基序列;(3)第三行以“+”開頭,隨后為Illumina測序標(biāo)識別符(選擇性部分);(4)第四行是對應(yīng)堿基的測序質(zhì)量,該行中每個字符對應(yīng)的ASCII值減去33,即為對應(yīng)第二行堿基的測序質(zhì)量值。2.2數(shù)據(jù)過濾統(tǒng)計測序