dxy logo
首页丁香园病例库全部版块
搜索
登录

Python和R,我该学哪个?【做科研的大师兄】

发布于 2022-11-01 · 浏览 1.1 万 · IP 广东广东
这个帖子发布于 2 年零 182 天前,其中的信息可能已发生改变或有所发展。

如今,数据就是资源,是生产资料,有了数据,就有了实现一切的基础。

这里数据主要指大数据,包括测序数据(如RNA-seq)、图像(如CT、MRI结果图)等多种类型,当然数据还包括湿实验数据等,我们这里不做展开。

想要利用生产资料制造产品,创造价值,我们就要有生产工具。

同样的,数据是生产资料,数据分析后写出来的文章就是产品,那生产工具是什么呢?

Python和R便是了。

那Python和R在医学大数据分析中的具体应用有哪些异同?

鉴于本人并非大数据分析相关方向背景,仅根据个人科研过程的经历,简要介绍一下二者的异同,以及在医学领域应用场景选择,如有遗漏,欢迎大佬在评论区补充讨论~

相同点:

  • 不论Python还是R语言,都是通过按照语言规则输入代码,实现数据建模、分析、可视化和机器学习等功能。


不同点:

  1. Python侧重于程序开发,机器学习和神经网络,需要有一定的变成基础;R语言侧重于数据分析及可视化,只要有SPSS软件操作经验,很容易上手;
  2. Python在医学领域主要应用于机器学习,神经网络。最典型的是医学影像图片的AI识别,feature提取和构建神经网络,机器学学习,建立诊断模型,这类文章可以参考我之前帖偏重临床,动物模型都没有的课题该怎么做?。需要注意的是,利用Python构建疾病诊断模型,往往是一个比较大的project,需要一个团队完成,所以不适合个人上手。
  3. R语言在医学领域非常擅长针对测序数据的分析和可视化(RNA-seq/单细胞测序等等)、临床回顾性统计分析等。当然Python也可以进行数据分析可视化,但是相比而言,R语言更有优势,也更容易上手。


实际上,结合我身边生信团队情况,医学研究生或医务人员应该优选学习R,对于测序上游数据分析再具备一点linux基础就够了,Python不建议选择

而好消息是,R语言很容易上手,熟悉一些基本操作,数据结构和数据清洗(从头开始学,敲代码实践,两三个月对普通人也够上手了),再掌握一点debug的方法,就可以利用丰富的R包资源来进行数据分析可视化了。

所以,以后不要问选哪个了,对于绝大部分医学生,肯定选择R!

最后编辑于 2022-11-01 · 浏览 1.1 万

44 279 65

全部讨论0

默认最新
avatar
44
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部