Python和R,我该学哪个?【做科研的大师兄】
如今,数据就是资源,是生产资料,有了数据,就有了实现一切的基础。
这里数据主要指大数据,包括测序数据(如RNA-seq)、图像(如CT、MRI结果图)等多种类型,当然数据还包括湿实验数据等,我们这里不做展开。
想要利用生产资料制造产品,创造价值,我们就要有生产工具。
同样的,数据是生产资料,数据分析后写出来的文章就是产品,那生产工具是什么呢?
Python和R便是了。
那Python和R在医学大数据分析中的具体应用有哪些异同?
鉴于本人并非大数据分析相关方向背景,仅根据个人科研过程的经历,简要介绍一下二者的异同,以及在医学领域应用场景选择,如有遗漏,欢迎大佬在评论区补充讨论~
相同点:
- 不论Python还是R语言,都是通过按照语言规则输入代码,实现数据建模、分析、可视化和机器学习等功能。
不同点:
- Python侧重于程序开发,机器学习和神经网络,需要有一定的变成基础;R语言侧重于数据分析及可视化,只要有SPSS软件操作经验,很容易上手;
- Python在医学领域主要应用于机器学习,神经网络。最典型的是医学影像图片的AI识别,feature提取和构建神经网络,机器学学习,建立诊断模型,这类文章可以参考我之前帖偏重临床,动物模型都没有的课题该怎么做?。需要注意的是,利用Python构建疾病诊断模型,往往是一个比较大的project,需要一个团队完成,所以不适合个人上手。
- R语言在医学领域非常擅长针对测序数据的分析和可视化(RNA-seq/单细胞测序等等)、临床回顾性统计分析等。当然Python也可以进行数据分析可视化,但是相比而言,R语言更有优势,也更容易上手。
实际上,结合我身边生信团队情况,医学研究生或医务人员应该优选学习R,对于测序上游数据分析再具备一点linux基础就够了,Python不建议选择。
而好消息是,R语言很容易上手,熟悉一些基本操作,数据结构和数据清洗(从头开始学,敲代码实践,两三个月对普通人也够上手了),再掌握一点debug的方法,就可以利用丰富的R包资源来进行数据分析可视化了。
所以,以后不要问选哪个了,对于绝大部分医学生,肯定选择R!
最后编辑于 2022-11-01 · 浏览 1.1 万