基因过表达(Overexpression)引物(primer)设计+质粒图谱详解

1 背景知识
1.1 基因过表达简介
在科学研究过程中探索生物学途径的经典遗传方法通常从感兴趣的表型的突变开始。得益于目前的高性能测序技术,人们能够很快掌握某种感兴趣的表型中的基因、蛋白、离子等的表达水平,从而去验证某一基因在该表型中扮演的角色。
针对基因,人们可进行的操作往往称为基因工程,当然随着时间的推移“基因工程”被赋予了更多的,更广泛的意义,而非原本的生物学方面的意义。本次主讲基因工程在生物学方面的意义及贡献。生物学实验室讲的基因工程(Genetic engineering):又称为遗传工程、转基因、基因修饰,是一种使用生物技术直接操纵有机体基因组、用于改变细胞的遗传物质的技术。实验/论文汇报过程最常见的基因编辑技术主要有:基因过表达(Overexpression, OE)或者称为基因敲入(Knock in, KI);基因敲低(Knock down, KD);基因敲除(Knock out, KO)。
基因剂量(gene dosage)对正常基因功能很重要的早期迹象源于核型分析,表明非整倍体是人类遗传综合征和果蝇和植物突变表型的原因。因此,与基因内的离散突变无关的整个染色体或部分染色体拷贝数的简单增加可能导致突变表型。基因过表达(gene overexpression):是将感兴趣的基因利用体外克隆手段组装到到相应的穿梭质粒或病毒载体上,利用载体骨架上构建的调控元件(往往具有强大的启动元件),使基因可以在人为控制的条件下实现大量转录(transcription)和翻译(Translation),从而实现目的基因的过表达。
1.2 过表达的常见途径
构建好过表达载体,它的用途是很多的(如图1所示),例如野生型过表达载体突变生物体中的作用;过表达突变蛋白;使用过表达研究互作网络(基因互作-蛋白互作,基因-蛋白互作等);过表达进行修饰位点验证;筛选靶向药物;异种过表达(常见某个基因过表达另一种低表达细胞中);过表达上位效应等。

(图1 过表达的常见用法 doi: 10.1534/genetics.111.136911)
1.3 过表达的功能
过表达某个基因后,会对生物特征的某个表型有抑制(inhibition)或者是激活(active),这往往使我们想看到的类型,当然也会出现无效的情况,或者其它情况。

(图2 基因过表达的作用机制简介。负责过表达表型的机制。过表达机制可以分为两大类,可以抑制(左列)或激活(右列)蛋白质,具体机制如下所述。对于每种变体,括号中提供了一个在案文中更充分讨论的代表性示例。(A)过表达可以通过影响其他蛋白质的转录,翻译或降解速率来简单地降低其稳态水平。(B)在多蛋白复合物中产生多个接触的亚基A的过表达可导致部分A-B,A-D或A-C亚组装,从而减少完整功能A-B-C-D复合物的量。(C)如果蛋白B参与两个独立的A-B和A-C复合物,非共享亚基A的过表达可以有效地竞争蛋白质B的限制量,从而减少功能性B-C复合物的数量。(D)仍能与其底物结合的突变酶A的过表达通过经典的显性阴性或反态机制与野生型酶A竞争该底物。(E)过表达可以在功能上灭活蛋白质,而与基于竞争的机制无关。这里描述,一个亚基的翻译后修饰破坏了蛋白质 - 蛋白质相互作用。(F)在通路其余部分完好无损的情况下表达正常沉默的基因可以激活其通路。(G)在表达但限制基因的条件下过表达基因可以增加总活性并刺激输出。(H)通过任何数量的机制抵消阻遏因子,包括抑制因子的降解,通过翻译后修饰或直接竞争使其失活可以激活途径。在这个例子中,基因A的过表达导致阻遏因子(rep.)的降解,释放活性蛋白B.(I)过表达可以增加其他蛋白质的特异性活性。最常见的机制可能是通过翻译后修饰。(J)过表达可以通过新形态效应激活新的途径。doi: 10.1534/genetics.111.136911)
1.4 过表达类型
按照基因过表达的生物材料中,根据基因过表达的时间来分类,可以分为瞬时表达(Transient overexpression)和稳定过表达(Stable overexpression)。一般情况下,瞬时过表达在48-72小时收集生物样品,基因的过表达情况能够达到数百倍的增加(qRT-PCR等检测);而稳定过表达是一个需要将过表达的基因整合到生物样品中的基因组中,通常需要借助病毒去整合靶基因到生物样品中的基因组中,后续的还需要经过特定的筛选方式以便获得稳定的表达的阳性细胞。(注意:筛选过程中,可以将病毒感染的细胞,但是目的基因未达到过表达的生物样品作为阴性对照,而实现了基因过表达的生物样品作为阳性组。)但是对于构建过表达载体的方法是类似的,甚至可以说是一样的。
1.4 过表达优点
过表达研究提供了几个优点:
(1)它是一种多功能工具,可以以多种方式应用于野生型和突变型背景;
(2)可以识别监管限速步骤;
(3)具有显性作用,因此在二倍体生物中易于进行;
(4)它甚至为冗余基因提供功能链接;
(5)它识别功能丧失基因的互补相互作用。
2 过表达引物设计实操
2.1 确定过表达质粒
我们使用最常见的过表达质粒pEGFP-N1(https://www.snapgene.com/plasmids/fluorescent_protein_genes_and_plasmids/pEGFP-N1)。

(图3 pEGFP-N1质粒图谱)
质粒图谱解读:
(1)MCS:一般称之为多克隆位点(multiple cloning site),也就是目的基因序列输入的位置,上边存在的酶切位点是允许实验人员添加到目的基因序列中,此处务必了解清楚;
(2)EGFP:一般称之为绿色荧光增强蛋白(enhanced green fluorescent protein),当穿梭质粒导入到细胞中,可以通过应该显微镜观察到绿色荧光,证实目的序列导入到靶细胞中的一种方式;
(3)SV40 poly(A):一般称之为猴空泡病毒 PolyA (simian virus 40 Ploy A,also called Poly A),它的作用主要有两个:1,终止基因转录;2,转录的mRNA添加Poly A尾巴(DNA序列,240bp左右)。mRNA的Poly A有助于真核生物中维持基因稳定,原核细胞中促进mRNA降解;
(4)f1 ori:f1 ori是f1噬菌体的ori,它的作用是可以控制ssDNA(单链DNA)的复制;
(5)ori:ori(origin)则是质粒在大肠杆菌内的复制起点,作用是能够使得在质粒序列上以滚环式复制的模式进行DNA复制,使得质粒可以在大肠杆菌(选择转化感受态的依据)中复制。
(6)AMP promoter:氨苄青霉素(ampicillin , AMP r)启动子,在阳性大肠杆菌(原核生物, procaryotic organism)中能够水解 β-内酰胺环,解除氨苄的毒性,这是在转化涂板时需要添加的抗生素(非常重要),如果不添加,则整个细菌培养皿中长满菌,添加错误导致没有菌生成。
(7)NeoR/(KanR):氨基糖苷磷酸转移酶 使 G418(长那霉素衍生物)失活,一般来说,只存在单抗性的质粒多为原核克隆载体和原核表达载体,而存在两种或以上的抗性的多为穿梭质粒, NeoR表示的真核抗性(Eukaryotic resistance),这里用于在真核表达过程中筛选阳性细胞的靶点。
(8)HSV TK Poly (A) signal:终止子信号,终止mRNA信号,Poly A起到稳定mRNA的作用。
随着生物科学技术的发展,不同用途的质粒不断被开发,质粒信息和功能变得越来越复杂,但是最基本的功能依旧如初。因此,拿到一个新的质粒时,一定要去详细了解这个质粒的信息,但人的记忆毕竟是有限的,对于一个质粒需要记住的信息大概是:1,MCS 多克隆位点中的两个(需要添加的两个个序列)位置,2,转化到原核菌种需要的抗性(一般是AMPr 和Kan r居多);3,导入到真核细胞中可能出现的表型(例如绿色荧光等);4,筛选阳性细胞能够用到的药物(比较常见的是G418, 嘌呤霉素等)。
2.2 获取目的基因序列(以human GPX4为例)
(a) NCBI中检索GPX4 human(顺序无所谓);

(b)找到需要的GPX4并单击;

(c)基因简介,初学者可以大概看看;

(d)基因在不同组织的表达情况,结合自己研究的组织或者细胞调整mRNA浓度(表达低时,可增加cDNA浓度)以便快速扩增目的基因;

(e)剪切体信息查看,可以看到human GPX4现目前拥有4个剪切体,根据实际情况,选择对应的剪切体(课题需要,最长,研究最多等信息)进行研究,在此,我们以第一个剪切体为例,单击NM_001039847.3;

(f)在FEATURES中定位CDS(Coding sequence)(单击CDS即可);

(g)保存基因序列
1,保存序列
分别复制GPX4 CDS 和mRNA序列,粘贴至txt文档中(复制了序列前边的数字也无所谓);

2,将.txt文档的后缀改为.seq,修改后缀的文档显示为DNAstar可打开的文档(DNAstar软件在文末);

3,比对CDS 和mRNA的位置关系。打开DNAstar软件的MegAlign(备注DNAstar安装好以后在启示启动位置显示为“Lasergene”);

(mRNA和CDS比对方法)

(确定CDS的起始密码子ATG的A始于mRNA的51号碱基位置)

(确定CDS的起终止码子TGA的A始于mRNA的734号碱基位置)
敲黑板:起始碱基和终止碱基位置的确定,保证在克隆过程中能够获得一条完整的GPX4 的CDS区(不完整是不能得到一条有效序列,更别谈后边翻译为蛋白)
2.3 利用oligo 7设计引物
(a)粘贴mRNA序列:打开oligo 7- file- new sequence(完成后点击“√”即可)

(b)上游引物设计
(定位51号碱基位置)

(定义为上游引物:Forward Primer)

(上游引物分析:引物二聚体(Duplex fomation);发卡结构( hairpin formation);错配(false priming site))

Duplex fomation:/ △G / ≤ 3(因此从分析结构看,不符合,只能往前边移动引物序列)

将启示位置移动到mRNA第6个碱基,并改变引物的长度(change- current oligo length)为18bp;
(/ △G / ≤ 3,符合要求)

(hairpin formation,最好是没有,但是实际情况很难达到,但是打开发卡结构的温度必须低于Tm值,符合要求)

(false priming site:priming efficiency:XXX(above the threshold)越低越好,但是这个值影响不大,可以是几十也可以是几百(处于第一行);第二行开始直至最后priming efficiency评分务必低于100,当然很难设计的引物可以适当高一些,但不能高于150)
(false priming site:priming efficiency:XXX(above the threshold)越低越好,但是这个值影响不大,可以是几十也可以是几百(处于第一行);第二行开始直至最后priming efficiency评分务必低于100,当然很难设计的引物可以适当高一些,但不能高于150)
(记录上游引物温度为:62.9,一般上下游引物温度相差不超过3度)

(b)下游引物设计
(定位下游引物的5’端始于CDS的最后一个碱基)

(点击下图右边的Reverse Primer,确定下游温度为58.2与上游的温度62.9相差超过3℃,适当延长下游引物长度即可(change- current oligo length))

(延长下游引物长度为20,Tm值为61.6,符合上下游引物温差要求,注意延长是往后边延长,因此延长了2个碱基,我们需要将序列5’端向前挪动2碱基,保证下游引物始于5’端)

同样进行引物二聚体(Duplex fomation);发卡结构( hairpin formation);错配(false priming site)分析;
(Duplex fomation:符合要求)

( hairpin formation:符合要求)

(false priming site:不符合要求, priming efficiency:XXX(above the threshold)符合要求;第二行137大于100不符合要,但137接近150,也可以作为备选,但是我们这里就要选择更好,同时也较大家怎么移动位置去设计下游引物)

更改下游引物的位置(当然几乎是1-4个碱基的往后挪动,无连续4-5个碱基或者大量GC的情况下),将下游5’端始于736。
然后分析引物二聚体(Duplex fomation);发卡结构( hairpin formation);错配(false priming site),这里就不在继续了,分析结果表明下游引物是符合要求的。
(c)保存引物
File- Save- Forward primer/ Reverse Primer(根据上下有信息分别保存),导出的引物默认设置为5’端到3’端。

得到的引物序列(命名为F1/R1的原因,是个人习惯,我喜欢用两步法来克隆CDS区:第一步尽可能的扩增到目的序列;第二步针对CDS再设计一对引物再在5’端加相应的酶切位点。当然也能够在F1/R1的5端加酶切位点。)
根据F1/R1设计引物(只需要合成F1/R1即可)

根据图3 质粒图谱的MCS选择
上游:Hind Ⅲ(622) AAGCTT;
下游:Kpn Ⅰ(649)GGTACC;
(上下游酶切位点最好能够间隔2-3个酶切位点或者更多,当然商品化的质粒可能能够不需要遵守这些规则,个人建议还是间隔一两个比较好,利于酶切增加效率提高成功概率)
F1: AAGCTT TCGGCTGGACGAGGGGAG
R1: GGTACC CGTCATGAGTGCCGGTGGAA
根据F2/R2设计引物(需要合成两对引物即根据F1/R1和F2/R2)
设计F2/R2,这里不需要讲规则了,适当注意一下上下游温度即可。
(上游引物5’端直接ATG开始,下游直接TGA 5’端开始,注意两者的方向是相反的)
F2: AAGCTT ATGAGCCTCGGCCGCCTT
R2: GGTACC TCATGAGTGCCGGTGGAA
(根据我多年的实践经验,设计两对引物成功的概率会显著性的提高)
(对了打开导出的引物序列需要DNAstar软件,最后在这里也一并送出(windows),下载地址:https://pan.baidu.com/s/1Xd1SGlGo6XxoRTi6NbApLQ;提取码:1179)
(写在最后,欢迎转载与引用,传播科学价值!!! 关注楼主GBhouse,如果有用,点赞+讨论是博主持续更新的动力!!!)
最后编辑于 2023-09-03 · 浏览 1.2 万