資源描述:
《關于DNA編碼的一些研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在工程資料-天天文庫。
1、遺傳密碼決定蛋白質中氨基酸順序的核昔酸順序,由3個連續(xù)的核苜酸組成的密碼了所構成。由于脫氧核糖核酸(DNA)雙鏈中一般只有一條單鏈(稱為有義鏈或編碼鏈)被轉錄為信使核糖核酸(mRNA),而另一條單鏈(稱為反義鏈)則不被轉錄,所以即使對于以雙鏈DNA作為遺傳物質的生物來講,密碼也用核糖核酸(RNA)中的核昔酸順序1佃不用DNA屮的脫氧核昔酸順序表示。遺傳密碼是一組規(guī)則,將DNA或RNA序列以三個核首酸為一組的密碼子轉譯為蛋白質的氨基酸序列,以用于蛋白質合成。兒乎所有的生物都使用同樣的遺傳密碼,稱為標準
2、遺傳密碼;即使是非細胞結構的病毒,它們也是使用標準遺傳密碼?,F(xiàn)在所遇到的問題就是:如何將交叉編碼后的堿基序列中不包含終止密碼子和開始密碼了(TAG,TGA,TAA)該問題也就是說:必須冇一種特定編碼方式使得交叉編碼后的堿基序列不包含終止密碼了,反響推導可以知道,存在一些特定的情況不能用于交義編碼中。以下就是推導論證方法:TAATAGTGAATG000ATTATCACTTAC001ATAATGACATAG010AATAACAGT1ICOilAAAAAGAGA1l<3100TTTTTCTCTAAC101
3、TTATTGTCAAAG110TATTACTGTATC111TAATAGTGAATG也就是說這些是不能用于進行隨機交義編碼的密碼子,除去重復的共有24種不可用的堿基密碼子:ACTACAAGTAGATCTTCATGTTGAATTATAAATAAATTTTTATAT7AAATCATGAACAAGTTCTTGTACTAG也就是說這24中編碼不能用于DNA編碼中?,F(xiàn)在又可以知道的是三位一個密碼了共冇4*4*4=64中編碼方式,意味著冇40種編碼方式可以使用(ACCACGAGCAGGTCCTCGTGCTGGC
4、AACATCACCAGCTACTTCTCCTGCCACCTCCCCCGCGACGTCGCCGGGAAGATGACGAGGTAGTTGTCGTGGCAGCTGCCGCGGGAGGTGGCGGG),40?26(英文字母表的字符個數(shù)),所以從理論來講使用一個密碼子編碼一個英文字符是可行的。優(yōu)點:相對于一般的將明文信息轉換為二進制數(shù)據(jù)再進行數(shù)字編碼的編碼方式而言,該編碼方式可以節(jié)省-?位的空間,尤其是在加密信息巨大的情況下,每一位的存儲空間都很珍貴。更加簡單,省去了很多的繁瑣的處理,只需要對照編碼即可。缺點
5、:隨機交義編碼的必要性:如果將編碼后的明文信息直接藏在一段序列中,入侵者可以很容易破解出明文。例如:假如ACC編碼字符A,ACG編碼字符B,AB的堿基編碼就是ACCACG,現(xiàn)在直接將編碼后的DNA序列藏于一段DNA序列的ORF:ATGTGGTGGTCCTAG屮,ATGTGGTACCACGGGTCCTAG。在這種情況下,可以使用不同的閱讀方式來破解:ATGTGGTACCACGGGTCCTAG這種情況下得到錯誤的信息。ATGTGGTACCACGGGTCCTAG這種悄況下就町以得到AB。所以由上例可以看出
6、,在進行DNA序列拼接之前還需要進一步的處理對于上例來說:ACCACG在一段指導編碼011010的指導作用下進行交叉編碼為TCCTCC,再將其編碼到ORF'I1:ATGTGGTGTCCTCCGTCCTAG對其進行不同的閱讀方式進行破解:ATGTGGTGTCCTCCGTCCTAGATGTGGTGTCCTCCGTCCTAGATGTGGTGTCCTCCGTCCTAG可以看到雖然第三種閱讀方式是正確的,但是在不知道明確信息的前提下,入侵者是不能區(qū)別的。就算入侵者能區(qū)別,他仍需要對該信息進行窮舉攻破,當數(shù)據(jù)位
7、數(shù)較小時,該工作很容易破解,但是當數(shù)據(jù)位數(shù)較人時,破解工作就顯得犬方夜譚。也就是說需耍4"屮情況。進一步的研究:ORF是指導蛋白質的一段可以編碼基因片段,該編碼非彼編碼,這里的編碼指導多肽的編碼,而上文的編碼指的是對字符的編碼。我們知道氨基酸有一個編碼表:--第二位堿基第二位堿基第二位堿基第二位堿基--TCAG第位堿基TTTT(Phe/F)苯丙氨酸TTC(Phe/F)苯丙氨酸TTA(LeT/L)亮氨酸TTG(LeT/L)亮氨酸TCT(Ser/S)絲氨酸TCC(Ser/S)絲氨酸TCA(Ser/S)絲
8、氨酸TCG(Ser/S)絲氨酸TAT(Tyr/Y)酪氨酸TAC(Tyr/Y)酪氨酸TAA(終止)TAG(終止)TGT(Cys/C)半胱氨酸TGC(Cys/C)半胱氨酸TGA(終止)TGG(Trp/W)色氨酸笫位堿CCTT(LeT/L)亮氨酸CTC(LeT/L)亮氨酸CTA(LeT/L)亮氨酸CTG(LeT/L)亮氨酸CCT(Pro/P)脯氨酸CCC(Pro/P)脯氨酸CCA(Pro/P)脯氨酸CCG(Pro/P)脯氨酸CAT(His/H)組氨酸CAC(His/H)組氨