dxy logo
首页丁香园病例库全部版块
搜索
登录

医学科研常用 24 大公共数据库汇总(含官网链接)

骨科医师 · 最后编辑于 09-11 · IP 江苏江苏
3448 浏览

临床研究类数据库

  1. SEER(美国癌症数据库):作为美国癌症统计的权威来源,自 1973 年启动数据收集,如今覆盖近 50% 美国人口。收纳百万级恶性肿瘤患者数据,详细记录发病率、死亡率、患病情况等核心信息,为全球肿瘤流行病学研究提供关键数据支撑 。
  2. NCDB(美国国家癌症数据库):由美国癌症协会与美国外科学院癌症委员会联合创立,收录全美超 70% 新诊断癌症病例,累积 3400 万 + 历史记录。数据源于全美 1500 多家医院,能全方位支持多癌种临床结局研究以及治疗质量评估 。
  3. MIMIC(重症医学数据库):由 MIT 和贝斯以色列女执事医疗中心(BIDMC)联合打造,是全球最大的免费 ICU 真实数据库。收录 2001 - 2019 年间 6 万 + 成人及新生儿重症病例,涵盖脓毒症、心梗、胰腺炎等病症,数据类型丰富,包括临床数据、高分辨率生理数据以及死亡数据 。
  4. Orphanet(罕见病数据库):1997 年由法国 INSERM 建立,2000 年起获欧盟资助并逐步发展为 40 国参与的联盟。汇总罕见病诊断、治疗、预后等知识,维护罕见病命名法(ORPHAcode),提升罕见病在医疗与研究信息系统中的可见性 。
  5. BioLINCC:聚焦心肺血液疾病领域,整合 110 + 研究机构的临床数据、流行病学数据以及生物样本信息,为心血管、血液系统疾病相关研究提供丰富的数据资源 。
  6. TCGA(癌症基因组图谱):针对 33 种癌症开展多组学研究,对 1.1 万 + 患者进行基因组、转录组等多维度综合分析。其多组学数据为深入挖掘癌症分子机制与临床关联提供有力支持 。

公共卫生与交叉学科数据库

  1. CHNS(中国健康与营养调查):由美国北卡罗来纳大学教堂山分校和中国疾病预防控制中心合作开展,跟踪 1989 - 2015 年中国人群的营养、健康状况以及社会经济因素变化,为研究中国人群公共卫生问题提供长期、全面的数据 。
  2. NHANES(美国国家健康与营养检查调查):美国国家级具有代表性的数据库,收集人口学信息、体格检查结果、实验室检测数据、饮食摄入情况以及环境暴露等多方面数据,广泛支持跨领域的交叉研究 。
  3. GBD(全球疾病负担数据库):提供全球及不同区域的疾病、伤害以及风险因素的量化数据,通过直观对比不同地区健康负担,为政策制定提供宏观层面的数据依据 。
  4. CLHLS(中国老年健康影响因素跟踪调查):由北京大学与杜克大学主导,专注于收集老年人健康状况、长寿因素以及社会支持等方面的数据,是研究老龄化相关问题的重要数据来源 。
  5. WHO Mortality Database:世界卫生组织官方的死亡数据库,收纳 1950 年至今的全球死亡原因数据,便于开展国际间死亡流行病学的比较研究 。
  6. UK Biobank:拥有 50 万人的大型队列数据库,整合全基因组数据、医学影像数据、表型数据,甚至包含穿戴设备采集的信息,多模态数据适用于长期随访研究以及精准医学探索 。

生物信息相关数据库

  1. METABRIC:乳腺癌多组学专项数据库,涵盖 2000 + 原发乳腺癌患者的多组学数据与详细临床资料,对深入开展乳腺癌分子分型与预后研究意义重大 。
  2. GEO(基因表达综合数据库):全球规模最大的基因表达数据仓库,存储基因表达、表观遗传等各类实验数据,支持对数据进行二次分析,是筛选差异基因常用的重要工具 。
  3. DGV(基因组变异数据库):作为健康人群基因组结构变异的权威目录,能够有效区分良性与致病性变异,为基因诊断研究提供关键参考 。
  4. DECIPHER:该数据库关联了基因变异与表型,收录数万例罕见病与发育异常病例信息,对罕见病的基因定位和精准诊断具有重要辅助作用 。
  5. OMIM(在线人类孟德尔遗传数据库):堪称孟德尔遗传病及相关基因的权威 “百科全书”,信息权威且更新及时,是研究单基因遗传病必不可少的查询工具 。
  6. CTD(比较毒理基因组学数据库):专注研究化学物质 - 基因 - 疾病之间的关联,为毒理学、环境医学以及精准医学研究提供核心数据支持 。
  7. Kaplan Meier Plotter:在线生存分析工具,只需输入基因或生物标志物,就能快速评估其与癌症预后的关系,极大提高了研究效率 。

医学影像数据库

  1. OASIS:聚焦阿尔茨海默病等神经退行性疾病,提供开放的影像数据集,包含结构 MRI 等影像数据,为神经影像基础研究提供重要数据资源 。
  2. DeepLesion:拥有 3 万 + 的 CT 多病灶检测数据集,覆盖多种常见病灶类型,是训练医学影像 AI 模型(尤其是病灶检测方向)的优质数据 。
  3. NITRC(神经信息学工具与资源中心):不仅汇聚神经影像数据,还整合了一系列影像处理工具,一站式满足神经影像研究在数据和工具两方面的需求 。
  4. ADNI(阿尔茨海默病神经影像计划):阿尔茨海默病研究领域的标杆数据库,收集多模态影像、认知量表以及生物标志物的纵向追踪数据,适用于研究疾病进展和早期诊断 。
  5. OAI(膝骨关节炎影像数据库):对 4796 名参与者的膝骨关节炎影像、临床数据以及生物标志物进行长期追踪,是骨关节炎影像与临床关联研究的核心数据来源 。
常用 24 大公共数据库汇总.pdf (592 KB)
恶性肿瘤 (155)
2 11 3

全部讨论(0)

默认最新
avatar
2
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部