SiRNA设计入门
RNAi(RNA interference)是由双链RNA诱发的、同源RNA高效特异性降解的现象。使用siRNA进行基因沉默因实验操作方便,深受广大科研工作者青睐,也成为了分子生物学应用中最常用的基因下调工具。
设计siRNA的第一步就是选择siRNA靶点,关于靶点设计的注意事项,如:同源区设计、blast比对等。
SiRNA设计原则

1.选择靶点序列
- 序列特点:19~21个碱基
- GC含量适中:35%-55%
- 避免出现超过4个连续的A或T
- 尽量设计在CDS区
- 序列位置分布均匀
2.分析靶点特异性
- 默认针对同源区设计
- 与非目的基因连续匹配的碱基数不超过15bp

RNAi作用机制

SiRNA设计方法

1.NCBI
从NCBI获取关键信息:Gene ID、Genbank ID、转录本之间的同源性。
在NCBI主页GENE界面输入“基因名称”、“物种”,搜索对应的基因。
基因界面显示多重信息:

下拉至“Genomic regions, transcripts, and products”,可以看到转录本信息Genbank ID(共计15个转录本),此ID与序列对应,可在核酸界面查询序列,Genbank ID命名规则如下:
- NM,XM--编码类型转录本(NM为认证的,XM属于预测的);
- NC,NG,AC等—基因组类型;
- NR,XR—非编码转录本(NR表示认证的,XR表示预测的);
- AK、AF等命名—看注释,大部分为文章的作者提交的序列。

Genbank ID对应的横线表示前体RNA
竖形方块表示外显子
浅色方块表示UTR
深色方块表示编码区
每个Genbank ID共有的方块即为同源区
选择转录较短及同源外显子最多的转录本设计靶点,位于同源区概率较大(如TP53基因NM_001276697和NM_001126115,此两个转录本只是一号外显子部分序列为非同源区)。
2.Invitrogen RNAi Designer设计
打开Invitrogen网站,选择“siRNA”,step1输入Genbank ID或者核酸序列,step2默认编码区;step3选择No Blast;step4 GC含量默认;step5位设计原则,默认即可,点击“RNAi Design”。

以设计NM_001276697为例,网站默认给出十个靶点及对应信息, Rank星星较多的靶点为高分值,Tuschl's pattern也是靶点评分方法,以A>B>C>D的评分排序。选择靶点可以综合参考这两项。

3.GE Dharmacon
GE Dharmacon为专业提供siRNA服务的公司,其设计网站具有一键同源区设计的功能,流程如下:
打开Dharmacon网站,步骤一有三种信息可填,分别为核酸序列(序列以fasta格式输入,为大于号命名,另起一行填序列)、Gene ID、Genbank ID。
步骤1:选择一个识别符类型

以TP53的Gene ID为例,输入7157,获取NCBI的转录本信息,同源区设计通过三个参数的调整(取部分截图):

“必填”为靶点靶向对应转录本(如果都选必填,那么就是针对同源区)
“准许”为可以靶向也可以不靶向对应转录本
“排除”为靶点不靶向对应转录本(可满足针对不同转录本设计特异性靶点的需求)
步骤2-4参数同Invitrogen,根据需求选择:

点击“设计siRNA”。评分从高到低,根据Accession的Genbank ID查找对应位置的序列(网站设计默认19bp的靶点),序列快速查找方式见视频snapgene快速导出核酸信息。

4.BLAST比对
每个设计网站blast使用的底层数据库有差别(NCBI数据一直在更新,不同时段有不同的数据版本,网站blast数据库不一定实时更新),导致blast结果不一。因此在设计时我们舍弃网站本身blast选项,直接以NBCI-blast比对靶点。打开BLAST网站:

填入核酸序列,选择比对数据库点击“blast”。人、小鼠有快速选项,若为其他物种,则点击“others”,“nr/nt”默认,物种输入指定的即可,下方给出三大物种指令:
Norway rat (taxid:10116)
house mouse (taxid:10090)
Homo sapiens (taxid:9606)

结果界面,Max Score列数值除以2表示匹配的碱基数;完全匹配的全部都是TP53基因的15个转录本,所以,靶点位于同源区;其次,非完全靶向的Max Score最大值为30.2,也就是跟基因SIPA1L2实际结合15个碱基,错配四个,符合特异性原则,该靶点blast结果OK。
以上即靶点设计及比对的流程,该方法同样适合非编码RNA,选择多个网站设计的共有靶点以及设计2~3个靶点进行验证,更加有利于筛选出有效靶点。