dxy logo
首页丁香园病例库全部版块
搜索
登录

SiRNA设计入门

最后编辑于 2022-10-09 · 来自 Android · IP 湖北湖北
4798 浏览
这个帖子发布于 4 年零 239 天前,其中的信息可能已发生改变或有所发展。

RNAi(RNA interference)是由双链RNA诱发的、同源RNA高效特异性降解的现象。使用siRNA进行基因沉默因实验操作方便,深受广大科研工作者青睐,也成为了分子生物学应用中最常用的基因下调工具。

设计siRNA的第一步就是选择siRNA靶点,关于靶点设计的注意事项,如:同源区设计、blast比对等。

SiRNA设计原则

img

1.选择靶点序列


  • 序列特点:19~21个碱基
  • GC含量适中:35%-55%
  • 避免出现超过4个连续的A或T
  • 尽量设计在CDS区
  • 序列位置分布均匀


2.分析靶点特异


  • 默认针对同源区设计
  • 与非目的基因连续匹配的碱基数不超过15bp


img


RNAi作用机制

img

SiRNA设计方法

img


1.NCBI

从NCBI获取关键信息:Gene ID、Genbank ID、转录本之间的同源性。


在NCBI主页GENE界面输入“基因名称”、“物种”,搜索对应的基因。


基因界面显示多重信息:

img



下拉至“Genomic regions, transcripts, and products”,可以看到转录本信息Genbank ID(共计15个转录本),此ID与序列对应,可在核酸界面查询序列,Genbank ID命名规则如下:


  • NM,XM--编码类型转录本(NM为认证的,XM属于预测的);
  • NC,NG,AC等—基因组类型;
  • NR,XR—非编码转录本(NR表示认证的,XR表示预测的);
  • AK、AF等命名—看注释,大部分为文章的作者提交的序列。

img


Genbank ID对应的横线表示前体RNA

竖形方块表示外显子

浅色方块表示UTR

深色方块表示编码区

每个Genbank ID共有的方块即为同源区


选择转录较短及同源外显子最多的转录本设计靶点,位于同源区概率较大(如TP53基因NM_001276697和NM_001126115,此两个转录本只是一号外显子部分序列为非同源区)。


2.Invitrogen RNAi Designer设计

打开Invitrogen网站,选择“siRNA”,step1输入Genbank ID或者核酸序列,step2默认编码区;step3选择No Blast;step4 GC含量默认;step5位设计原则,默认即可,点击“RNAi Design”。


img



以设计NM_001276697为例,网站默认给出十个靶点及对应信息, Rank星星较多的靶点为高分值,Tuschl's pattern也是靶点评分方法,以A>B>C>D的评分排序。选择靶点可以综合参考这两项。


img




3.GE Dharmacon

GE Dharmacon为专业提供siRNA服务的公司,其设计网站具有一键同源区设计的功能,流程如下:


打开Dharmacon网站,步骤一有三种信息可填,分别为核酸序列(序列以fasta格式输入,为大于号命名,另起一行填序列)、Gene ID、Genbank ID。


步骤1:选择一个识别符类型

img



以TP53的Gene ID为例,输入7157,获取NCBI的转录本信息,同源区设计通过三个参数的调整(取部分截图):


img


必填”为靶点靶向对应转录本(如果都选必填,那么就是针对同源区)

准许”为可以靶向也可以不靶向对应转录本

排除”为靶点不靶向对应转录本(可满足针对不同转录本设计特异性靶点的需求)


步骤2-4参数同Invitrogen,根据需求选择

img



点击“设计siRNA”。评分从高到低,根据Accession的Genbank ID查找对应位置的序列(网站设计默认19bp的靶点),序列快速查找方式见视频snapgene快速导出核酸信息。


img




4.BLAST比对

每个设计网站blast使用的底层数据库有差别(NCBI数据一直在更新,不同时段有不同的数据版本,网站blast数据库不一定实时更新),导致blast结果不一。因此在设计时我们舍弃网站本身blast选项,直接以NBCI-blast比对靶点。打开BLAST网站:


img



填入核酸序列,选择比对数据库点击“blast”。人、小鼠有快速选项,若为其他物种,则点击“others”,“nr/nt”默认,物种输入指定的即可,下方给出三大物种指令:

Norway rat (taxid:10116)

house mouse (taxid:10090)

Homo sapiens (taxid:9606)

 

img



结果界面,Max Score列数值除以2表示匹配的碱基数;完全匹配的全部都是TP53基因的15个转录本,所以,靶点位于同源区;其次,非完全靶向的Max Score最大值为30.2,也就是跟基因SIPA1L2实际结合15个碱基,错配四个,符合特异性原则,该靶点blast结果OK。


以上即靶点设计及比对的流程,该方法同样适合非编码RNA,选择多个网站设计的共有靶点以及设计2~3个靶点进行验证,更加有利于筛选出有效靶点。

3 208 29

全部讨论(0)

默认最新
avatar
3
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部