今天是生信星球陪你的第337天
大神一句話,菜鳥跑半年。我不是大神,但我可以縮短你走彎路的半年~
就像歌兒唱的那樣,如果你不知道該往哪兒走,就留在這學點生信好不好~
這里有豆豆和花花的學習歷程,從新手到進階,生信路上有你有我!
豆豆寫于19.4.12
主要研究真核生物
基因結構包括編碼區(qū)(CDS)和非編碼區(qū)
編碼區(qū):不連續(xù)的基因結構,又包含外顯子和內含子,它們交替出現(xiàn)
外顯子:編碼區(qū)中不連續(xù)的具有蛋白編碼功能的DNA序列
第一個外顯子的頭部是蛋白翻譯的起始密碼子;最后一個外顯子的尾部是終止密碼子,一般富含AT-
內含子:編碼區(qū)中外顯子之間間隔的非編碼序列
外顯子與內含子的鄰接部位是一段高度保守的序列:外顯子尾巴與下一個內含子的頭部多數(shù)是GT,內含子的尾巴與下一個外顯子的頭部多數(shù)是AG,可以簡單記做GT-AG
法則,作為RNA剪切的識別信號
DNA=》pre-mRNA(mRNA前體)或者hnRNA(核內不均一RNA)=》(成熟)mRNA,其中pre-mRNA中包括了外顯子和內含子,成熟的mRNA才只剩外顯子
開放閱讀框ORF:從DNA的起始密碼子(ATG)到終止密碼子(TAA、TGA、TAG)的堿基序列,且不包含終止密碼子
非編碼區(qū):又叫'側翼序列flank
',是編碼區(qū)第一個外顯子+最后一個外顯子以外的區(qū)域,也就是指這個區(qū)域中包含了啟動子、終止子、增強子等調控元件
上游側翼(第一個外顯子以外的序列):包含啟動子區(qū)域(promoter)
啟動子的作用是與RNA聚合酶特異性結合
第一個外顯子的5'轉錄起始位點(TSS)上游大約20-30個堿基的位置,是TATA box
,包含的堿基位置是TATAATAAT
,保證RNA聚合酶可以準確識別轉錄起始位點并開始轉錄過程??偠灾?,它影響轉錄起始
第一個外顯子的5'轉錄起始位點上游大約70-80個堿基的位置,是CAAT box
,包含的堿基位置是GGCTCAATCT
,它是另一個RNA聚合酶的結合位點,它不影響轉錄起始,但可以控制轉錄起始頻率 。另外CAAT box
兩側是GC box
,包含的堿基是GGCGGG
,起到轉錄調節(jié)、激活轉錄的功能
增強子:一般位于TSS上游大約100個堿基以外,具有增強轉錄的作用,但是不用于啟動基因轉錄
沉默子:抑制DNA的轉錄過程,從而抑制翻譯,最常見是位于啟動子上游。有時也會出現(xiàn)在啟動子下游、基因本身內含子或外顯子上;另外在下游側翼的3'非翻譯區(qū)也發(fā)現(xiàn)了沉默子
參考:http://www.bogari.net/Bogari/Principle_files/4-genomes.pdf
下游側翼(最后一個外顯子以外的序列):包含終止子序列
首先在最后一個外顯子的終止密碼子下游有一個AATAAA
序列,這個序列主要參與mRNA 的多聚腺苷酸化過程。多聚腺苷酸化就是得到polyA尾巴之前,mRNA的3'端會水解掉10-15個堿基。這個序列的作用就是作為RNA裂解的信號,指導核酸內切酶在此信號下游10~15堿基處裂解 mRNA。之后就是聚合酶作用使得3'端加上polyA變成成熟mRNA
AATAAA
序列再往下到轉錄終止位點(TTS)之前,是一個反向重復序列(7-20個堿基對),轉錄后形成一個發(fā)卡結構,可以阻礙RNA聚合酶移動,終止轉錄
注意:起始密碼子和終止密碼子都在外顯子上,位于編碼區(qū);但是,轉錄起始位點TSS和轉錄終止位點TTS都在非編碼區(qū),TSS在啟動子區(qū)下游&起始密碼子上游,TTS在終止子區(qū)下游&終止密碼子下游
pre-mRNA就是從轉錄起始位點TSS到終止位點TTS,還需要進行內含子剪切,5'加帽子結構,3'加PolyA修飾,才可以形成成熟mRNA
包括編碼區(qū)、5'UTR、3'UTR、5'帽子結構、3'polyA尾
編碼區(qū):起始密碼子AUG開始,到終止密碼子(UAG、UAA、UGA)的堿基序列
UTR:mRNA兩端的非編碼序列
5'UTR:上游非編碼區(qū),位于5'帽子與起始密碼子(AUG)之間
3'UTR:下游非編碼區(qū),位于編碼區(qū)末端的終止密碼子到3’尾巴之間
5'帽子:作用就是幫助mRNA跨過核膜,進入胞質,并且此過程中保護5‘不被降解;翻譯時保證IFiii和核糖體識別
3’poly-A尾巴:作用也是幫助mRNA跨過核膜,進入胞質,并且增加了mRNA在胞質中存在的穩(wěn)定性。因為mRNA的降解過程是隨著時間延長,A尾逐漸變短;
promoter雖然感覺和起始相關,但是它既不屬于外顯子也不屬于內含子,它是非編碼區(qū)序列
UTR其實是mRNA中的概念,但是在往上溯源,在DNA序列中算是外顯子exon的部分
CDS序列以ATG開始,起始密碼子只有這一個,并且在外顯子中
一個基因中有外顯子和內含子,但是基因和基因也不是連續(xù)的,它們之間的區(qū)域就不是intron內含子了,而是叫做'基因間區(qū)',同樣屬于非編碼序列
單順反子mRNA:只編碼一個蛋白的mRNA;多順反子mRNA:編碼多個蛋白
圖1
圖2
聯(lián)系客服