生物信息入门知识最详最全总结,小白入门解惑,大神提升借鉴!
听说生物信息很热,但如何自学生物信息学呢?如果你看过过很多方法文章仍一头雾水不明所以,这篇文章可以帮助到你。
写在前面
生物信息学是什么?
Bio + informatics=Bioinformatics
生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。
作为一门跨学科的科学领域,生物信息学将计算机科学,统计学,数学和工程学结合起来,分析和解释生物学数据。生信未来整体前景非常好,需求超过了供给。对于做烦实验的科研人员来说,生信能够给你的更多,并且能够使你迅速转到进展更快的研究上,就算以后不走学术研究,计算技能也是高度可转移的,并且是终生受益的。虽然现在还没有很系统的教材和资料,不过你不妨从这篇入手开始或者重振生信之路。
考虑到大家之前的水平参差不齐,这里划分三个段位,分别是初中高级三种介绍学习生物信息所需要具备的能力和对应教辅资料,一方面大家可以更好的对号入座,另一方面也可以随时查漏补缺。快来看看你在初段的哪一级别吧!
对于一个初学者或者已经入门的
如何来确定自己的方向
首先是从事或者学习生物信息要经历的几个阶段的划分:
∞ 初级,菜鸟,入门
∞ 初中级,数据处理员,执行员,操作员
∞ 中级,讲师,助理研究员
∞ 初高级,学者,老师,副研究员
∞ 高级,研究员,大师,学家
再次是职业发展方向的划分,存在哪些生态位:
ʚ 生物信息实习生
ʚ 生物信息学分析人员
ʚ 生物信息学工程师
ʚ 生物信息学研究主管
ʚ 生物信息学研究员
01初级
生命科学的重点已由实验分析和数据积累
开始向数据分析及其指导下的实验验证转移
生命科学正在经历着从分析还原思维到系统整合思维的转变
正是因为这样的转变,
生物信息初级阶段
已经成为分子生物学的相关的专业的一个普遍要求,会查找和利用数据资源,会对数据进行基本的分析,或许你的方向不同,所要求你掌握的重点也不同
如果刚刚开始,下面的提纲,可以供你参考,
这是来自于实践的,而不是某种教学大纲。
生物学背景:Ø 熟悉核酸、蛋白质、RNA、中心法则等遗传学的相关概念,原理;Ø 熟悉基因、基因组、基因组计划,测序方法、遗传图谱、物理图谱等相关知识;Ø 了解基本的实验流程,比如PCR、凝胶电泳、文库、基因克隆、RC-PCR、x杂交、芯片等基因工程方面的实验的原理、流程;Ø 专业英文基础
计算机背景: Ø 了解基础的网络知识,网络使用方法,如用Google进行搜索; Ø 了解操作系统,会软件的安装与卸载; Ø 了解基本的文件类型,比如什么是文本文件,会使用不同的程序打开相同的文件;
生物信息学:Ø 熟悉NCBI、EBI、DDBJ等网站的数据库,会熟练对核酸、蛋白质数据库进行检索,并对检索结果按照指定格式进行批量下载;Ø 熟悉常用的数据格式,比如FASTA,Genbank,Swissprot,aln等,并会使用文本编辑器查看、编辑这些文件;Ø 会使用网络版的BLAST、Cluster等软件的基本功能,会简单的结果分析;会对测序结果进行处理比如去除载体,序列核对,鉴定等,了解峰图的含义;Ø 会DNAMAN、Primer5、MEG、BioEidt等软件的安装与使用;
你可以做什么了:Ø 了解基因组研究进展,为实验设计做前期的调研,分析准备工作;Ø 测序结果的分析,得出结论;
示例:Ø 基因的clone与鉴定,比如通过16s RNA序列鉴定新物种;
参考书目:Ø 《基因组》Ø 《生物信息》
02初中级
这个级别可以根据自己的发展方向、兴趣爱好
选择侧重点,可以选择偏向生物方面的对于生物统计、生物化学、物理化学等学科深入学习
方向侧重于算法研究方面;另一方面可以侧重计算方面,对于linux操作系统、数据库、perl、java、web技术等深入进行学习
当然这两个方向又是互补的
不是仅仅选择一个就可以了
生物学方面:Ø 系统生物学方面,对于物种演化等有深入的理解;Ø 对于组学,比如基因组、蛋白组、代谢组、表达谱等等的理解;Ø 对于线性代数、生物统计等的深入学习;Ø 对于蛋白质的二级、三级结构,核酸的结构、物理化学性质进行深入的学习;Ø 专业英文的学习,多看外文资料
计算机方面:Ø linux操作系统的熟悉,系统的安装、环境的配置,软件的编译安装,涉及到操作系统,要学习的地方就有很多。Ø perl的学习;Ø Java、C++的学习;Ø 数据库比如mysql的初步了解,安装,建表,简单的查询;Ø Apache的了解
生物信息学方面:Ø 学习一些算法,Blast、Cluster等比对如何实现的;Ø Blast的本地化,可以进行库对库的比对,并可以对结果进行处理;Ø 了解常用的软件,并能根据操作手册进行安装使用,并能说明你为什么要用这个软件;Ø 了解NCBI上的各个数据库,会使用BLAST的高级功能,会使用seqin提交数据;Ø 会使用bioperl,进行数据格式的转变等
你可以做什么了:画系统树,可以得到专家的认可。
参考书目:Ø 《生物化学》Ø 《生物信息》
03初高级
这个级别的特点体现在创新
新的算法,得到新的结论
新的流程,提高了效率
新的界面,提高了可用性
新的平台,促进了数据的交流与共享
你需要:各种表达谱数据处理、系统生物学方面、算法开发方面、综合分析平台的建立
蛋白质组方面、功能基因组方面、没有列到的其他方面
01综合分析平台的建立:Ø 复杂数据库的设计;Ø 并行集群的使用;Ø 海量数据的存储与检索;
02各种表达谱数据的处理:Ø 更加易用的软件的开发,多种处理方法的集合
03蛋白质组方面:Ø 符合规范共享系统的建立
04:功能基因组方面:Ø 基因预测的精度Ø 比较基因组
参考资料
基本没有什么书可以参考,要靠你出书了。
好了初级的说完了,中级和高级的后面更新,敬请期待!
最后编辑于 2022-10-09 · 浏览 3354