基因过表达构建攻略(一)

发现了感兴趣的基因,想让它在自己养的细胞中过表达,该如何实现呢?
目前来说,让基因过表达的方式主要有三种,构建外源基因过表达,CRISPR SAM,saRNA。这里我们主要介绍下构建外源基因过表达。
首先,我们需要获得目的基因序列,可通过NCBI中的Gene数据库进行查找,这里以GPX4为例。

选择人源的基因,进入下级界面

往下翻,直到mRNA and Protein(s)

如果有异构体,根据需要选择,这里我们以第一条为例,点击进入下级界面

向下翻到CDS,CDS指的是编码序列(Coding sequence)

点击进入

点击FASTA,进入下级界面

在该界面中我们可以得到目的基因编码序列和大小(右上角)。
接下来我们要选择适当的质粒载体,根据实验室现有或购买的慢病毒质粒载体图谱,选择适宜的两个酶切位点(1.两个酶切位点距离大于6bp; 2.常见的限制性内切酶位点;3.可用同一buffer)。另外,在选择酶切位点时须确保目的基因片段中不含所选择的酶切位点(具体方法参见文末)。值得注意的是,本文介绍的是传统的双酶切法,如果使用同源重组法则会省事很多。
有了目的基因序列,确定好质粒中的酶切位点后,我们要做的就是将该基因片段插入质粒两个酶切位点之间。
如何实现呢?首先需要得到带酶切位点的基因片段。可以让公司合成,也可以PCR获取。这里就介绍下如何通过PCR得到带酶切位点的基因片段。
首先在NCBI找一下该基因高表达的组织细胞

用该基因高表达的细胞提取RNA(Trizol或者相应试剂盒提取),反转录后(反转录试剂盒)用合成好的带保护碱基及酶切位点的引物(带酶切位点引物设计方法见文末)进行PCR(使用高保真酶进行PCR,避免错配)。PCR条件根据需要调整和优化。随后将PCR产物进行琼脂糖电泳(通常是1%),切下目的基因片段对应的胶块,进行胶回收(使用胶回收试剂盒),胶回收后测DNA浓度(通常用Nano drop仪测)。此时我们就获得了带酶切位点的基因片段。
接下来我们对带酶切位点的基因片段和载体质粒分别进行双酶切,得到粘性末端。常用的NEB酶切体系效率挺高,一般5-15分钟就完成了。如果担心酶切不彻底,可适当延长酶切时间(酶切反应可在EP管或pcr管中进行,采用37度金属浴)。
酶切完成后,对目的基因和质粒进行琼脂糖电泳及胶回收,测定胶回收产物浓度,此时的目的基因及载体质粒上均带有双酶切位点粘性末端。
通过T4连接酶对目的基因及质粒进行连接操作,反应体系,连接时间及温度参考购买的T4连接酶说明书。
连接完成后,我们取5微升产物进行转化(转化是指将目的质粒导入感受态细胞的过程)。
以stable3感受态细胞为例,从-80度冰箱取一支stable3感受态细胞,置于冰上解冻,数分钟后加入5微升连接产物,轻柔混匀,冰上放置30分钟,42度水浴90秒(或者45秒),该步骤称为热激。冰上放置2分钟后,加入500微升SOC(购买的stable3感受态细胞会附带SOC)或者LB培养基。放入摇床,设置37度200rpm转速复苏一小时,如果担心质粒发生错误重组,可将温度降至30度。
将复苏好的感受态细胞以300G转速离心5分钟,弃上清,留下50至100微升液体,吹匀后将菌液加入带相应抗性(根据质粒抗性而定)的选择性固体培养基平板(常用的是氨苄),用接种环划线,静置数分钟(晾干),倒置平板放入37度培养箱,12-16小时后取出已经长出细菌的选择培养基平板。
准备数个含抗性的LB培养基摇菌管,挑取数个单菌落,每个摇菌管加入一个单菌落,37度摇床200rpm转速摇菌,12-16小时后取出。
此时可将菌液送去测序(或者对菌液小提后,将质粒送去测序),也可以先对菌液PCR,通过琼脂糖凝胶电泳确定是否含目的基因,再将含目的基因的菌液(或者提出的质粒)送去公司测序。测序需要我们提供测序引物,可设计合适引物将目的基因测通,引物设计这里略去,不会设计可以让测序公司帮忙设计(一般不收费或者很便宜)。
待测序结果返回后,我们对结果进行比对,如果无误,我们的过表达质粒就算构建好了。
有了过表达质粒,我们就可以构建过表达细胞株了,具体步骤,我们下期继续。
Tips:Ⅰ分析目的基因所含酶切位点,确保选定酶切位点不在目的基因中,以经典的primer 5软件为例。
复制目的基因序列到primer 5

点击Enzyme,进入分析界面。添加酶切位点,进行分析

选择好后,点击OK,就可以查看基因片段包含哪些酶切位点

Ⅱ设计带酶切位点引物时要注意引入保护碱基,可以去搜索NEB保护碱基。
这里举例说明,假如要给GPX4设计带酶切位点EcoRI和NotI的引物。
将GPX4的CDS序列粘贴到primer5

点击Primer

从起始处得到正向引物,默认给了25bp,可以根据需要适当删减碱基,使Tm值在适当范围,通常在55-70摄氏度左右。
通过网上查询保护碱基和酶切位点序列,我们得到带EcoRI保护碱基的正向引物
ECOR1: CG(保护碱基)+ GAATTC(EcoRI序列)+ATGAGCCTCGGCCGC(GPX4正向引物)
接下来是反向引物,稍微麻烦一点,先从网上找到酶切位点序列和保护碱基序列
NOTI: GCGGCCGC(NOTI序列) TAAACTAT(保护碱基)
互补转换CGCCGGCG ATTTGATA
通过Primer 5得到GPX4反向引物

注意图上的红色方框,我们要得到CDS全长,而不是一个片段。为了保证不错位,我们可以人为在序列后面添加几个碱基

这样我们就可以在末尾进行删减,而不影响片段全长且保证不错位

得到TCATGAGTGCCGGTGGAAG
最后我们反向引物就是ATAGTTTA(保护碱基) GCGGCCGC(NOTI序列) TCATGAGTGCCGGTGGAAG(GPX4反向引物)
设计好引物后交给公司合成。
本文仅供参考,如有缺漏,欢迎评论指正!