手牵手写个网药2
二、靶点标准化
在前面已经获取了香附的中药成分+靶点信息,接下来便是对靶点信息进行标准化。就像你在家叫小王,在村里叫狗蛋,朋友叫你狗剩,但没用,唯一被外面人所承认的是你掏出证件后的名字。靶点也是如此,命名众多,故需对此进行命名的标准化,转换为对应的gene symbol。
1.方法一:直接怼
打开uniprot官网,便可见一搜索框,把前面收集的诸多靶点分别输入,search,复制,粘贴,完成。
缺点:看网速,网速不好,半小时能搜完算快的了。
2.方法二:Vlookup函数
①点击Swiss-Pro
②分别选择Reviewed,Human。(经实验验证过的人类靶点信息)
③Download→Format:Excel→Uncompressed→Go(将实验验证过的人类靶点信息
统一下成未解压的excel格式,后续操作可不用通过uniprot官网,仅需在excel上操作即可,故对于网络不好的用户可选择该方法)
④excel文件处理:分别对Protein name列以“(”“[”进行分列;对“Gene name”列以空格分列;并通过TRIM()函数去除分列后的前后空格。结果如图所示:
⑤Vlookup查找
通过Vlookup函数匹配靶点蛋白名搜索对应的基因名,如图:通过该方式可匹配出大多数gene symbol,但对于出现#N/A的靶点,可另自行输入uniprot官网单独查找。
三、疾病靶点查找
数据库GeneCards:https://www.genecards.org/,特点:直接导出,无需靶点标准化。
将疾病名直接输入即可:
symbol为靶点的基因名,此处已为标准化,无需另外转化;根据Score大小,筛选排名较前的靶点,视为该疾病的关系性较好的靶点。
点击export要求log in,注册一个账户即可。导出成excel格式。这时候,中药-疾病的靶点分别处理完成,接下来可对二者进行操作处理。
最后编辑于 2022-10-09 · 浏览 1711