dxy logo
首页丁香园病例库全部版块
搜索
登录

顶刊精读 | 2型糖尿病病理生理学异质性的遗传驱动因素

发布于 2024-10-12 · 浏览 523 · IP 香港香港
img

Basic Information

  • 英文标题: Genetic drivers of heterogeneity in type 2 diabetes pathophysiology
  • 中文标题:2型糖尿病病理生理学异质性的遗传驱动因素
  • 发表日期:19 February 2024
  • 文章类型:Article
  • 所属期刊:Nature
  • 文章作者:Ken Suzuki | Eleftheria Zeggini

Abstract

Para_01

  1. 2型糖尿病(T2D)是一种异质性疾病,通过多种不同的病理生理过程和通常特定于细胞类型的分子机制发展而来。
  1. 在这里,为了表征这些过程在不同祖先群体中的遗传贡献,我们汇总了来自2,535,601个个体(39.7%非欧洲血统)的全基因组关联研究数据,包括428,452例T2D病例。
  1. 我们识别出1,289个独立关联信号达到全基因组显著性(P < 5 × 10−8),这些信号映射到611个位点,其中145个位点据我们所知是之前未报告的。
  1. 我们定义了八个不重叠的T2D信号簇,这些信号簇以不同的心血管代谢特征关联谱为特征。
  1. 这些簇在不同细胞类型特异性开放染色质区域中差异富集,包括胰腺胰岛、脂肪细胞、内皮细胞和肠内分泌细胞。
  1. 我们在进一步279,552个不同祖先的个体中构建了簇特异性分区多基因评分,包括30,288例T2D病例,并测试了它们与T2D相关血管结局的关联。
  1. 簇特异性分区多基因评分与冠状动脉疾病、外周动脉疾病和终末期糖尿病肾病在不同祖先群体中相关,突显了肥胖相关过程在血管结局发展中的重要性。
  1. 我们的发现展示了整合多祖先全基因组关联研究数据与单细胞表观基因组学来解析驱动T2D发展和进展的病因异质性的价值。
  1. 这可能会为优化全球获取基于遗传信息的糖尿病护理提供一条途径。

Main

Para_01

  1. 糖尿病是一种巨大的公共卫生负担,据估计2021年全球有5.37亿成年人患有糖尿病,其中超过90%的人患有2型糖尿病。
  1. 2型糖尿病发展的生物过程多种多样,包括胰岛素分泌受损和胰岛素抵抗。
  1. 这种病因异质性导致患者表型存在显著差异,包括疾病发病年龄、疾病并发症的表现以及对管理策略的反应。
  1. 尽管环境和生活方式是2型糖尿病的公认风险因素,但在35至60岁人群中,遗传率估计为69%。
  1. 之前的全基因组关联研究(GWAS)已识别出超过500个2型糖尿病风险位点,这些位点通过效应基因以不同的分子机制与临床特征表现出不同的关联模式,这些机制通常具有细胞类型特异性。
  1. 通过新成立的2型糖尿病全球基因组倡议,我们呈现了一项非常大规模的2型糖尿病GWAS数据荟萃分析结果,涵盖超过250万具有不同祖先背景的个体——与之前的研究相比,有效样本量增加了近三倍。
  1. 我们利用这一增加样本量所带来的优势,将GWAS数据与来自疾病相关组织的新兴单细胞功能基因组学数据相结合,以揭示2型糖尿病的病因异质性。
  1. 此外,我们在多个祖先群体中构建了分区的多基因分数(PS),并评估了它们与2型糖尿病相关的大血管结局及微血管并发症进展的关联。

Study overview

Para_01

  1. 我们汇集了GWAS数据,包括428,452例2型糖尿病(T2D)病例和2,107,149例对照(补充图1和补充表1及2)。
  1. 我们将这些GWAS数据组织成六个基因相似的研究子集,我们称之为‘祖先群体’(扩展数据图1)。
  1. 具体来说,我们考虑了:一个欧洲祖先群体(EUR,占有效样本量的60.3%);一个东亚祖先群体(EAS,占19.8%);一个以西部非洲和欧洲血统为主的混血非裔美国人群体(AFA,占10.5%);一个以美洲、西部非洲和欧洲血统为主的混血西班牙裔群体(HIS,占5.9%);一个南亚祖先群体(SAS,占3.3%);以及一个南非祖先群体(SAF,占0.2%)。
  1. 关联分析考虑了研究层面的种群结构和亲缘关系,并在适当的情况下调整了年龄和性别,以及额外的特定研究协变量(补充表3和方法)。

Discovery of T2D loci

Para_01

  1. 我们通过多祖先元回归汇总了跨全基因组关联研究(GWASs)的关联总结统计,该过程在MR-MEGA(参考10)中实现,允许与祖先相关的等位基因效应异质性。
  1. 我们在元回归模型中包括了三个遗传变异轴作为协变量,以区分来自不同祖先群体的GWASs(扩展数据图1和方法),这导致基因组控制膨胀低于固定效应元分析(λGC分别为1.120和1.396)。

Para_02

  1. DIAMANTE联盟先前提倡使用多祖先全基因组显著性阈值(P < 5 × 10−9)来定义位点,这考虑了在多祖先元分析后预期的单核苷酸变异(SNVs)之间的较弱连锁不平衡(LD)。
  1. 为了深入了解符合传统全基因组显著性(P < 5 × 10−8)的真实阳性信号,这些信号在更严格的阈值下可能会被忽略,我们考虑了DIAMANTE联盟报告的位点,这些位点贡献了当前研究有效样本量的39.5%。
  1. 在DIAMANTE联盟分析中,有39个位点的关联信号符合5 × 10−9 ≤ P < 5 × 10−8,其中36个(92.3%)在我们当前研究中可用的大样本量下达到了多祖先全基因组显著性(补充文本)。
  1. 因此,我们将下游分析的重点放在符合传统全基因组显著性阈值的SNVs上。

Para_03

  1. 我们共识别出1,289个不同的2型糖尿病(T2D)关联信号(P < 5 × 10−8),这些信号由独立的(r2 < 0.05)索引单核苷酸变异(SNVs)代表(补充图2,补充表4和方法部分)。
  1. 这1,289个关联信号映射到611个位点,其中145个(23.7%)位点据我们所知在之前的T2D全基因组关联研究(GWASs)中未曾报道。
  1. 在映射到之前未报道的T2D位点的关联信号中,索引SNVs主要是常见的(至少在一个祖先群体中次要等位基因频率(MAF)高于5%),其比值比(ORs)低于1.05(补充图3)。

Mechanistic clusters of T2D index SNVs

Para_01

  1. 为了理解T2D表型异质性的遗传贡献,我们将1,289个索引SNV根据其与37种心血管代谢表型的关联特征(与T2D风险等位基因对齐)进行分类。
  1. 这些表型包括血糖特征、人体测量指标、体脂和脂肪组织体积、血压、循环血浆脂质水平,以及肝功能和脂质代谢的生物标志物(补充表5)。
  1. 我们采用了一种无监督的‘硬聚类’方法,并对缺失的表型关联进行了插补,识别出八个互不重叠但全面的索引SNV子集,它们具有相似的心血管代谢特征(图1,表1,扩展数据图2,补充图4,补充表6和7及方法部分)。
Fig. 1: Heat map of associations of 37 cardiometabolic phenotypes with 8 mechanistic clusters of index SNVs for T2D association signals.
img

  • 每一列对应一个聚类。每一行对应一个心血管代谢表型。每个单元格的‘温度’表示该表型与分配给该聚类的索引SNVs关联的z分数(与T2D风险等位基因对齐)。*表型已根据体重指数进行调整。
Table 1 Cardiometabolic profile, example loci and physiological effect of index SNVs at T2D association signals allocated to eight mechanistic clusters 表1 2型糖尿病关联信号分配到八个机制簇的代谢心血管特征、示例基因座和指标单核苷酸变异的生理效应
img

Para_02

  1. 我们观察到,我们识别的五个聚类的心血管代谢特征和位点与之前研究报道的重叠3,4,20,21,这些聚类代表了与胰岛素原(PI)呈正或负相关的β细胞功能障碍,以及通过肥胖、脂肪营养不良和肝脏及脂质代谢介导的胰岛素抵抗(补充表8)。
  1. 在两个β细胞功能障碍聚类中的索引SNVs上的2型糖尿病(T2D)风险等位基因与空腹血糖、两小时血糖和糖化血红蛋白的增加有关,与空腹胰岛素的减少有关。
  1. 这两个聚类中的索引SNVs也与胰岛素原(PI)相关,但对于T2D风险等位基因的影响方向相反。
  1. 反映通过肥胖、脂肪营养不良和肝脏及脂质代谢介导的胰岛素抵抗机制的聚类包括与人体测量指标和循环血浆脂质水平相关的索引SNVs。
  1. 在肥胖聚类中的索引SNVs上的T2D风险等位基因与体质指数(BMI)、腰臀比(WHR)、体脂百分比和基础代谢率的增加有关,与高密度脂蛋白(HDL)胆固醇的减少有关。
  1. 脂肪营养不良聚类包括索引SNVs,其T2D风险等位基因与空腹胰岛素、腰臀比、血压和甘油三酯的增加有关,与体脂百分比、臀股部脂肪组织(GFAT)体积和高密度脂蛋白(HDL)胆固醇的减少有关。
  1. 分配到肝脏和脂质代谢聚类的索引SNVs上的T2D风险等位基因与肝脂肪和肝脏相关生物标志物的增加有关,与低密度脂蛋白(LDL)胆固醇和总胆固醇的减少有关。

Para_03

  1. 通过将聚类中的索引单核苷酸变异(SNV)数量相对于之前的努力增加了近四倍,我们提供了对2型糖尿病(T2D)关联影响疾病的生物学过程的更细致的视图,并突出了三个先前未报告的信号簇,这些信号簇具有代表性的代谢综合征、体脂和残余血糖效应的心血管代谢特征。
  1. 我们观察到在这三个簇中T2D的等位基因效应显著弱于之前报道的簇(平均OR值为1.028,而之前为1.033,P = 2.2 × 10−7),但在簇间质心周围的差异没有明显不同(扩展数据图3,补充表9和补充图5)。
  1. 分配到代谢综合征簇的索引SNV处的T2D风险等位基因与空腹血糖、腰臀比、甘油三酯和血压的增加以及高密度脂蛋白胆固醇的减少相关,这些指标共同用于定义代谢综合征。
  1. 该簇中的T2D风险等位基因还与空腹胰岛素的增加、不健康脂肪沉积的积累(内脏脂肪组织(VAT)体积和肝脂肪的增加)以及葡萄糖转运蛋白(GFAT)体积的减少相关。
  1. 之前的调查已经显示,患有代谢综合征的个体患T2D的风险增加,尽管孟德尔随机化研究表明,因果效应是由腰围增加和空腹血糖增加驱动的。
  1. 分配到体脂簇的索引SNV处的T2D风险等位基因与腹部皮下脂肪组织体积、VAT体积和体脂百分比的增加相关。
  1. 尽管体脂簇的关联特征与肥胖介导的胰岛素抵抗有共同之处,但体脂簇中的索引SNV与BMI、血脂水平或基础代谢率没有强关联。
  1. 之前的调查已经强调,体脂百分比可以预测健康BMI个体的异常血糖。
  1. 最后,分配到残余血糖簇的索引SNV处的T2D风险等位基因与空腹血糖和糖化血红蛋白的增加最为强烈相关,但与两个β细胞功能障碍簇不同,它们与胰腺胰岛素(PI)或空腹胰岛素的减少无关联。

Para_04

  1. 聚类提供了一个框架,以更好地理解2型糖尿病(T2D)发展的多样化生理过程以及与其他胰岛素抵抗相关疾病(包括妊娠糖尿病(GDM)和多囊卵巢综合征(PCOS))共享的生物学途径。
  1. 在索引单核苷酸变异(SNVs)上的T2D风险等位基因在不同聚类中显示出对胰岛素相关内表型的梯度效应(补充文本,扩展数据图4和补充表10和11),这代表了一种从两个β细胞功能障碍聚类中的胰岛素产生和处理到在脂肪营养不良聚类中最极端的胰岛素抵抗的渐变。
  1. 在β细胞+PI聚类中的索引SNVs与GDM显示出最强的关联,而在肥胖聚类中的那些与PCOS关联最强(补充文本,扩展数据图5和补充表12)。

Regulatory processes underlying clusters

Para_01

  1. 为了深入了解支持机制性簇的组织特异性调控过程,我们将2型糖尿病(T2D)关联信号与来自30种人类成年和15种人类胎儿组织的222种细胞类型的单细胞染色质可及性图谱(CATLAS和DESCARTES)的转座酶可及染色质测序(ATAC-seq)峰以及来自人类大脑的额外106种细胞类型27的图谱进行了整合(图2,补充表13和14及方法部分)。
Fig. 2: Heat map of cluster-specific enrichments of T2D associations for cell-type-specific regions of open chromatin derived from single-cell ATAC-seq peaks in adult and fetal tissue.
img

  • a, 来自30种人类成人组织和15种人类胎儿组织的细胞类型(共222种类型)。
  • b, 来自人类大脑的细胞类型(共106种类型)。
  • 在每个面板中,列代表机制聚类。
  • 每一行代表在至少一个聚类中显著富集(经Bonferroni校正细胞类型数量)的细胞类型(用星号表示)。
  • 每个细胞的‘温度’定义了对数折叠富集的大小。
  • 肝脏和脂质代谢聚类未呈现,因为它仅包含三个2型糖尿病关联信号,且模型参数估计不稳定。

Para_02

  1. 我们观察到在胰腺胰岛中的胎儿胰岛和成人神经内分泌细胞(α、β、γ和δ)中,开放染色质区域在β细胞+PI、β细胞−PI和残余血糖簇中显著富集。
  1. 此外,残余血糖簇在胎儿和成人胰腺导管细胞中富集,而β细胞−PI簇在成人肠嗜铬细胞中富集——肠嗜铬细胞是一种肠内分泌细胞,在调节胃肠道运动和分泌中起着至关重要的作用。
  1. 肠嗜铬细胞是胰高血糖素样肽1(GLP-1)的主要靶标,并且高度表达GLP-1受体,其激动剂被广泛用作治疗2型糖尿病的药物。

Para_03

  1. 肥胖簇在成人胰腺胰岛的开放染色质区域中也显著富集,尽管不如β细胞功能障碍簇那么强烈。
  1. 仅在α、γ和δ细胞中观察到富集,这表明除了通过β细胞分泌胰岛素外,胰岛还通过其他途径影响2型糖尿病的发展。
  1. 肥胖簇进一步在胎儿肾上腺细胞(嗜铬细胞和肾上腺神经元)、胎儿心脏细胞(心室心肌细胞)和胎儿肾脏细胞(后肾细胞)中富集。
  1. 先前的研究报告了BMI位点或遗传力在胰腺胰岛和肾上腺中的表观基因组注释富集,这与我们的发现一致。
  1. 在人类大脑中,肥胖簇在包括内嗅投射神经元(IT)、生长抑素阳性(SST+)GABA能抑制神经元和D1中型多棘神经元在内的细胞类型的开放染色质区域中显著富集。
  1. SST+ GABA能神经元存在于下丘脑中,并调节食物摄入。
  1. D1中型多棘神经元是人类纹状体中的一种GABA能神经元,表达D1型多巴胺受体;这些神经元被认为与食物动机和在小鼠中饮食诱导的肥胖发展有关。

Para_04

  1. 剩余的四个聚类(脂肪营养不良;代谢综合征;体脂;以及肝脏和脂质代谢)在胰腺岛中的开放染色质区域没有显著富集。
  1. 脂肪营养不良聚类仅在成年脂肪细胞中富集,这证实了之前在大块脂肪组织中的报告。
  1. 与这些结果一致的是,WHR、甘油三酯和HDL胆固醇的关联信号,这些受脂肪营养不良聚类中的索引SNVs强烈影响的指标,已被显示在脂肪细胞的候选顺式调控元件中富集。
  1. 代谢综合征聚类在血管壁内的细胞(成年周细胞和胎儿内皮细胞)、胎儿肾细胞(系膜细胞)和胎儿成纤维细胞中富集。
  1. 收缩压和舒张压的关联信号,作为代谢综合征的关键组成部分,已被显示在这些细胞类型的候选顺式调控元件中富集。
  1. 内皮功能障碍不仅是胰岛素抵抗的后果,还会损害胰岛素信号传导,进一步降低胰岛素敏感性,从而提供了一个病理生理机制,将代谢综合征的代谢和心血管成分联系起来。
  1. 在人类大脑中,代谢综合征聚类在包括IT投射神经元和SST+ GABAergic抑制性神经元在内的细胞类型的开放染色质区域显著富集。
  1. IT投射神经元是大脑皮层中一种谷氨酸能兴奋性锥体神经元,代谢综合征之前在GWAS研究中与锥体神经元和GABAergic神经元在细胞类型特异性分析中相关联。
  1. 我们在体脂聚类或肝脏和脂质代谢聚类中没有观察到显著富集。

Ancestry-correlated heterogeneity

Para_01

  1. 先前多祖先全基因组关联研究(GWASs)显示,在2型糖尿病(T2D)关联信号中,等位基因效应在不同祖先群体之间存在广泛异质性。
  1. 我们利用元回归模型将异质性分为两部分:一部分是与祖先相关的成分,由三个遗传变异轴解释;另一部分是剩余成分,反映了环境暴露差异(与祖先不相关)和/或研究设计差异(补充表15)。
  1. 我们观察到127个(9.9%)独立的T2D关联信号具有显著的祖先相关异质性证据(PHET < 3.9 × 10−5,Bonferroni校正,1289个信号)。
  1. 我们预计少于一个信号会达到这一显著性阈值,这突出表明祖先相关异质性在T2D关联中显著富集(单侧二项式检验P < 2.2 × 10−16)。
  1. 相比之下,我们仅在四个(0.3%)关联信号中观察到显著的剩余异质性证据(单侧二项式检验P = 0.031)。
  1. 因此,这些结果表明,在索引单核苷酸变异(SNVs)上的等位基因效应差异与遗传祖先的相关性比与其他GWASs之间变化的因素更强。

Para_02

  1. 我们接下来试图更好地理解遗传多样性对127个具有显著祖先相关异质性证据的关联信号在GWASs之间等位基因效应差异的影响(方法)。
  1. 对于118个(92.9%)信号,等位基因效应大小与遗传变异的前两个轴最为密切相关,这两个轴分别反映了AFA/EUR与EAS GWASs之间的差异(AFA–EAS轴),以及AFA/EAS与EUR GWASs之间的差异(AFA–EUR轴)(补充文本,扩展数据图1和6以及补充表16)。

Para_03

  1. 我们观察到在AFA-EAS轴(P = 4.1 × 10−6)和AFA-EUR轴(P = 1.5 × 10−6)之间,集群关联的平均z得分存在显著差异。
  1. 两个胰岛β细胞功能障碍集群中的索引SNVs与AFR-EAS轴的正相关最强,表明在EAS GWASs中T2D的等位基因效应大于AFA和EUR GWASs(扩展数据图7和补充表17)。
  1. 相比之下,脂肪营养不良和肥胖集群中的索引SNVs与AFA-EUR轴的正相关最强,表明在EUR GWASs中T2D的等位基因效应大于EAS和AFA GWASs。
  1. 这些结果表明,祖先相关的异质性在不同机制集群之间存在差异,其中在通过胰岛β细胞功能障碍作用的集群中,EAS GWASs的等位基因效应最强,而在通过胰岛素抵抗作用的集群中,EUR GWASs的等位基因效应最强。

Para_04

  1. GWASs之间等位基因效应的祖先相关异质性并非由祖先群体之间等位基因频率的差异驱动,但如果在关联分析中未考虑,可能由于索引SNVs与环境和生活因素的相互作用而发生。
  1. 我们观察到在T2D病例和对照中,研究层面的平均BMI分布在不同祖先群体之间存在显著差异(补充图6)。
  1. 这种变异可能会影响祖先相关的异质性,因为当病例和对照从BMI分布的极端选择时,通过β细胞功能障碍作用的T2D信号的等位基因效应估计值可能会被放大。
  1. 因此,我们将MR-MEGA元回归模型扩展,以允许由于T2D病例和对照中的平均BMI以及遗传变异轴导致的索引SNVs的等位基因效应异质性(方法)。

Para_05

  1. 在对2型糖尿病(T2D)病例和对照组的队列水平平均BMI进行调整后,只有24个关联信号保留了显著的祖先相关异质性证据(P < 3.9 × 10−5),而未调整时有127个信号(补充文本和补充表18)。
  1. 在调整BMI后,AFA-EUR轴上簇间关联的平均z分数的显著差异得以保持(P = 3.2 × 10−5,未调整时为P = 1.5 × 10−6),而AFA-EAS轴上的差异则未保持(P = 0.18,未调整时为P = 4.1 × 10−6)。
  1. 此外,在调整BMI后,两个β细胞功能障碍簇与AFA-EAS轴的强正相关不再显著(扩展数据图7和补充表19)。
  1. 综合这些结果,表明东亚(EAS)GWASs与欧洲/非洲裔美国人(EUR/AFA)GWASs之间等位基因效应的异质性,最常出现在分配给β细胞功能障碍簇的关联信号上,主要由这些祖先群体中T2D病例和对照组的平均BMI分布差异所解释。

Associations of partitioned PS with outcomes

Para_01

  1. 2型糖尿病(T2D)患者的主要并发症包括大血管病变,如冠状动脉疾病(CAD)、缺血性卒中和外周动脉疾病,以及微血管病变,包括终末期糖尿病肾病(ESDN)和增殖性糖尿病视网膜病变。
  1. 我们在多达279,552名个体(包括30,288例T2D病例)中测试了特定簇的分区PS与这些血管病变的相关性,这些个体来自五个祖先群体(AFA、EAS、EUR、HIS和SAS),数据来源于"我们所有人"研究计划、日本生物银行和基因与健康研究(方法)。
  1. 这些个体未包含在多祖先荟萃分析中,从而避免了由于发现集和测试集重叠而导致的I型错误率潜在膨胀。
  1. 为了最大化样本量,我们在所有个体中测试了大血管病变,并调整了T2D状态,仅在T2D个体中测试微血管并发症(方法和补充表20)。
  1. 为了评估分区PS相较于总体T2D PS提供的额外信息,不考虑簇成员资格,我们在调整总体PS后测试了分区PS的每个簇特异成分的相关性。
  1. 图3提供了分区PS的每个簇特异成分与五个血管病变在不同祖先群体中的相关性的概览。
Fig. 3: Associations of cluster-specific components of the partitioned PS with five T2D-related vascular outcomes in up to 279,552 individuals from multiple ancestry groups.
img

image

  • 每个分区PS的集群特异性成分与CAD、缺血性中风(IS)、外周动脉疾病(PAD)、ESDN和增殖性糖尿病视网膜病变(PDR)的相关性摘要。
  • 每个条形的高度对应于PS每标准偏差的对数优势比(beta),灰色条形显示95%置信区间。
  • 对T2D相关的大血管并发症(CAD、PAD和IS)的分析在所有个体中进行,并调整了T2D状态。
  • 微血管并发症的分析仅在T2D个体中进行。
  • *P < 0.05,名义关联;**P < 0.0063,针对八个集群的Bonferroni校正。
  • 确切的P值在补充表21中提供。

Para_02

  1. 我们观察到分区的PS的两个组分与CAD之间存在显著关联(P < 0.0063,Bonferroni校正八个簇):与β细胞+PI簇呈负相关(每标准差PS的OR = 0.96,P = 1.3 × 10−6),与肥胖簇呈正相关(OR = 1.04,P = 0.00019)。
  1. 没有证据表明这些两个簇对CAD的影响在不同祖先群体之间存在异质性(补充图7和补充表21)。
  1. 值得注意的是,在调整了来自先前发表的多祖先CAD GWASs元分析的CAD PS后,分区的PS的两个组分与CAD的正相关仍然显著(扩展数据图8和补充表22):β细胞+PI簇(OR = 0.96,P = 4.4 × 10−5)和肥胖簇(OR = 1.04,P = 0.00065)。
  1. 我们还观察到分区的PS中的肥胖簇与外周动脉疾病之间存在显著的正相关(OR = 1.05,P = 0.00045),且没有证据表明其影响在不同祖先群体之间存在异质性(补充图8和补充表21)。
  1. 在所有三种大血管结局中,总体趋势是与β细胞+PI簇呈负相关,与肥胖簇呈正相关,尽管分区的PS中没有特定簇的组分在缺血性卒中上达到显著性(补充图9和补充表21)。
  1. 在跨祖先群体的元分析后,总体T2D PS与CAD(P = 0.17)、缺血性卒中(P = 0.022)或外周动脉疾病(P = 0.77)之间没有强关联。
  1. 综合来看,这些结果突显了分区PS相对于总体T2D PS在检测与大血管结局关联方面的优势,并提供了对其发展过程的生物学机制的见解。

Para_03

  1. 我们观察到分割后的PS的两个组成部分与ESDN有显著关联:与β细胞+PI簇呈负相关(OR = 0.83,P = 0.00024),与肥胖簇呈正相关(OR = 1.19,P = 0.00050)。
  1. 这些两个簇在不同祖先群体中的效应没有异质性的证据(补充图10和补充表21),总体PS与ESDN的关联不强(P = 0.048)。
  1. 相比之下,分割后PS的任何簇特异性组成部分均未与增殖性糖尿病视网膜病变相关。
  1. 然而,总体PS与这种微血管结局有强烈的正相关(OR = 1.32,P = 1.1 × 10−9),且在不同祖先群体中的效应没有异质性的证据(补充图11和补充表21)。
  1. 综合来看,这些结果表明ESDN与肥胖和β细胞功能障碍相关,效应方向相反,并证实了先前的报告,即增殖性糖尿病视网膜病变由高血糖驱动,因此与T2D风险变异的总体负担强烈相关。

Para_04

  1. 最后,我们测试了分区PS的簇特异性成分和整体T2D PS与T2D发病年龄之间的关联(扩展数据图9和方法)。
  1. 整体PS与较早的发病年龄显著相关(每标准差PS为1.15年,P = 5.1 × 10−8),尽管其效应在不同祖先群体中高度异质(补充图12和补充表23)。
  1. 然而,即使在调整整体PS后,肥胖簇仍与较早的发病年龄显著相关(0.38年,P = 1.4 × 10−7),且没有证据表明在不同祖先群体中存在异质性。
  1. 这些发现强调了肥胖相关过程对T2D发病的重要性,除了对血管并发症的发展外。

Associations with vascular outcomes in clinical trials

Para_01

  1. 为了深入了解肥胖和β细胞+PI簇与更广泛血管结局的关联,我们评估了分区PS(在调整总体PS后)在前瞻性GWAS中的表现,这些研究涉及来自六个临床试验的29,827名EUR T2D个体,这些试验来自心肌梗死溶栓(TIMI)研究组(方法和补充表24)。
  1. 我们观察到分区PS的簇特异性成分与因心力衰竭住院风险之间的最强关联:与肥胖簇呈正相关(风险比(HR)= 1.15,每标准差PS,P = 4.8 × 10−6),与β细胞+PI簇呈负相关(HR = 0.90,P = 0.00092)。
  1. 在宏观血管结局中,β细胞+PI簇也与心血管死亡(HR = 0.90,P = 0.0020)、主要心血管事件(HR = 0.94,P = 0.0050)和心肌梗死(HR = 0.94,P = 0.027)呈负相关。
  1. 对于微观血管结局,这两个簇在白蛋白尿上的效应方向相反:肥胖簇(HR = 1.06,P = 0.012)和β细胞+PI簇(HR = 0.95,P = 0.047)。
  1. 在所有结局中,普遍趋势是与肥胖簇呈正相关,与β细胞+PI簇呈负相关(扩展数据图10),这与我们在不同祖先群体的回顾性GWAS分析中观察到的关联一致。

Discussion

Para_01

  1. 为了更好地理解2型糖尿病(T2D)在不同人群中的病因异质性,我们通过2型糖尿病全球基因组倡议,汇编了六大祖先群体的T2D全基因组关联研究(GWASs)的大型集合。
  1. 通过将有效样本量增加到几乎是先前努力的近三倍,我们总共鉴定出611个达到常规全基因组显著性阈值(P < 5 × 10−8)的位点,其中145个(23.7%)据我们所知尚未被先前报道。
  1. 这一常规阈值相当于对EUR参考数据中独立单核苷酸变异(SNV)的有效数量进行Bonferroni校正。
  1. 利用来自1000基因组项目、DIAMANTE联盟和其他研究者的实证数据,倡导在多祖先群体元分析中使用更为严格的阈值,因为连锁不平衡(LD)的结构在不同祖先群体中被打破,独立SNV的有效数量增加。
  1. 事实上,我们的分析表明,达到常规全基因组显著性的位点不太可能是假阳性关联信号,而是由具有中等效应的索引SNV驱动,这些SNV需要更大的样本量才能满足更严格的阈值。
  1. 因此,我们推荐使用这一常规阈值,但倡导仔细审查报告的信号,以确保关联不是由单一研究或不良估算的变异驱动,以防止假阳性。

Para_02

  1. 多祖先元回归通过允许在索引SNV处的等位基因效应存在异质性,最大化了检测跨祖先群体共享关联的能力。
  1. MR-MEGA并不局限于可以用来强化群体间基本遗传差异概念的广泛大陆祖先标签,而是将祖先表示为遗传变异的连续轴,这更好地反映了人类遗传多样性和人口历史的连续性。
  1. 然而,重要的是要强调,我们的元分析并未完全捕捉到全球遗传多样性,特别是非洲、南美和中美洲、中东和大洋洲等代表性不足的群体。
  1. 例如,在祖先比例最高的个体中,98.2%的总有效样本量是非洲裔美国人。
  1. 这些个体的祖先代表了一种以西部非洲为主的混合渐变,因此不能代表非洲的其他地区,这些地区的遗传变异水平与其他大陆群体之间的差异相当。
  1. 加强在这些代表性不足群体中的GWAS收集仍然是人类遗传学研究社区的紧迫优先事项,并突显了谨慎解释结果的必要性,避免将发现泛化到对偏倚代表性敏感的祖先群体。

Para_03

  1. 在2型糖尿病(T2D)的遗传架构景观中,我们识别了八个具有不同关联特征的索引单核苷酸变异(SNV)集群,这些集群定义了与病理生理学相关的分组。
  1. 通过多祖先元分析发现的以前未报告的T2D信号的增加,帮助定义了三个在之前的聚类努力中未检测到的集群,这些集群具有与残留血糖效应、体脂积累和代谢综合征一致的心血管代谢特征。
  1. 这些先前的努力实施了‘软聚类’方法,例如贝叶斯非负矩阵分解,为每个索引SNV生成集群成员资格的权重。
  1. 索引SNV分配到集群的决定是基于集群成员资格的阈值权重,允许T2D关联信号通过多种病理生理途径影响疾病。
  1. 然而,根据集群成员资格的阈值,一些索引SNV将无法分配。
  1. 贝叶斯非负矩阵分解还将与同一表型的正负关联视为独立变量,而大多数聚类方法无法直接处理缺失的表型关联。
  1. 为了解决这些潜在的局限性,我们实施了一种方法,该方法联合进行索引SNV的k-means聚类和缺失表型关联的强大迭代多重插补。
  1. 在这种‘硬聚类’方法中,每个索引SNV被精确地分配到一个集群。
  1. 因此,这可能存在一个潜在缺点,即具有异常或中间表型关联特征的索引SNV被‘强制’分配到一个不太合适的集群。
  1. 然而,我们通过硬聚类识别的以前未报告的集群与先前报告的集群相比并没有明显更分散,这表明我们没有通过将所有SNV强制分配到一个集群而引入大量噪声。
  1. 最终,聚类方法的选择可能取决于任何下游调查的目标。

Para_04

  1. 我们的分析突显了与祖先相关异质性相关的2型糖尿病(T2D)关联信号的显著过剩,这主要由非洲裔美国人(AFA)、东亚人(EAS)和欧洲人(EUR)全基因组关联研究(GWASs)之间的等位基因效应差异所驱动。
  1. 两个β细胞功能障碍簇与AFA-EAS轴的关联最为强烈,其中在EAS GWASs中的效应通常比其他祖先群体的效应更大。
  1. 这两个簇也与胰岛素分泌减少和胰岛素抵抗降低最为强烈相关。
  1. 相比之下,以胰岛素敏感性降低和胰岛素抵抗增加为特征的脂肪营养不良和肥胖簇,与AFA-EUR轴的关联最为强烈,其中在EUR中的效应通常比其他祖先群体的效应更大。
  1. 这些观察结果与报告不同祖先群体间T2D发病机制差异的研究一致,其中T2D在EUR个体中主要通过增加胰岛素抵抗而引发,但在EAS个体中则以胰岛素分泌减少和胰岛素抵抗降低为特征。
  1. 我们已经表明,大多数与祖先相关异质性的信号可以通过T2D病例和对照在不同祖先群体间BMI分布的差异来解释。
  1. 此外,在调整研究水平的平均BMI后,我们观察到沿AFA-EAS轴的簇间等位基因效应没有差异。
  1. 这与先前的研究一致,这些研究报道身体组成是EAS和EUR个体间T2D发病机制变异的主要决定因素,因为在校正BMI差异后,两个祖先群体的胰岛素敏感性和β细胞反应相似。

Para_05

  1. 我们在多个祖先群体中揭示了血管结局与分割后PS的簇特异性成分之间的显著关联,在调整整体PS后,这表明疾病轨迹与某些生物学通路中的遗传负担相关,而这些通路在不同人群中是一致的。
  1. 尽管分割后PS的簇特异性成分的效应大小较小,但它们激励未来的工作通过在更大样本量中识别更多的T2D关联来增强这些效应。
  1. 通过与多种细胞类型的单细胞染色质可及性数据整合,它们还增强了对驱动T2D表型临床特征异质性的关键生物学过程的理解。
  1. 例如,PS的肥胖簇特异性成分与CAD和ESDN呈正相关,并包括在胎儿心室心肌细胞、胎儿肾上腺神经元、成人肾上腺髓质细胞和胎儿后肾细胞中开放染色质区域的索引SNVs。
  1. 这些发现与在包括主动脉和动脉、心脏和肾上腺在内的bulk组织中报告的CAD关联信号的转录组和表观基因组注释富集,以及肾脏组织特异性调控注释中肾脏功能关联信号的富集是一致的。
  1. 总的来说,这些发现为驱动T2D和其他血管疾病发展的共享生物学机制提供了明确的联系。

Para_06

  1. 总之,我们的研究结果展示了整合多祖先群体2型糖尿病(T2D)和心血管代谢特征的GWAS研究以及跨多种组织的单细胞表观基因组学,以解析驱动不同人群组中T2D发生和进展的病因异质性的价值。
  1. 更好地理解将T2D与血管结局联系起来的多样化病理生理过程,可以为基于遗传信息的糖尿病护理提供途径,并为从T2D GWAS研究中获得的临床转化提供全球性机会。

Methods

Study-level analyses

研究水平分析

Para_01

  1. 在每个研究中,我们通过自我报告和遗传背景将个体分配到祖先群体(补充表1和2)。
  1. 任何未分配到祖先群体的个体都被排除,作为人群异常值。
  1. 在每个特定祖先群体的GWAS中,我们对基因型数据进行质量控制,并使用来自精准医学项目的跨组学参考面板51、哈普型参考联盟52、1000基因组项目(第1阶段,2012年3月发布;第3阶段,2014年10月发布)53,54,或人群特异的全基因组测序55,56,57,58,59,60,61(补充表3)进行填充。
  1. 使用UCSC LiftOver工具( https://genome.ucsc.edu/cgi-bin/hgLiftOver )将映射到GRCh38(hg38)的参考面板的研究调整回hg19。
  1. 我们排除了填充质量差和/或次要等位基因计数(MAC)< 5的SNVs(补充表3)。

Para_02

  1. 在每个特定祖先群体的全基因组关联分析(GWAS)中,我们通过广义线性(混合)模型测试了每个单核苷酸变异(SNV)与2型糖尿病(T2D)的关联,采用次要等位基因的加性剂量模型,并根据年龄和性别(在适当的情况下)以及额外的特定研究协变量进行调整(补充表3)。
  1. 我们使用了不同的策略来考虑人群分层和/或亲缘关系:(一)排除密切相关个体,并将从遗传相关性矩阵(GRM)中提取的主成分作为额外协变量进行调整;或(二)将GRM作为随机效应纳入模型(补充表3)。
  1. 从线性混合模型中估计的等位基因效应和相应的标准误差被转换为对数优势比尺度。
  1. 我们通过LD评分回归截距校正了研究层面的关联汇总统计量以消除残留结构(补充表3),使用我们从1000基因组项目(第三阶段,2014年10月发布)中的大陆群体匹配的祖先单倍型中提取的LD参考。
  1. 我们将非洲裔美国人(AFA)的GWAS与‘非洲’大陆群体匹配,将西班牙裔美国人(HIS)的GWAS与‘美洲’大陆群体匹配。

Multi-ancestry meta-analyses

多祖先荟萃分析

Para_01

  1. 我们分析了与1000基因组项目(第三阶段,2014年10月发布)54和单体型参考联盟52的参考面板重叠的常染色体双等位SNV。
  1. 我们考虑了在1000基因组项目(第三阶段,2014年10月发布)54中至少一个五大洲群体中MAF > 0.5%的SNV。
  1. 我们排除了在相同单体型子集中比较参考面板时,等位基因频率差异超过20%的SNV。

Para_02

  1. 我们使用 MR-MEGA10 中实现的元回归,来汇总跨 GWAS 的关联总结统计。
  1. MR-MEGA 模型通过在元回归模型中包括遗传变异轴作为协变量,来捕捉 GWAS 之间的多样性,从而建模与遗传血统相关的等位基因效应异质性。
  1. 我们使用所有研究中报告的 SNV 来构建每个 GWAS 对之间平均效应等位基因频率差异的距离矩阵。
  1. 我们对距离矩阵进行多维缩放,以获得三个主成分,这些主成分代表遗传变异轴,用于区分不同血统群体的 GWAS(扩展数据图 1)。

Para_03

  1. 对于每个单核苷酸变异(SNV),我们通过线性回归聚合了跨全基因组关联研究(GWASs)的逆方差加权等位基因效应,包括三个遗传变异轴作为协变量。
  1. 我们进行了以下测试:(一)允许在不同GWAS之间存在与祖先相关的等位基因效应异质性的2型糖尿病(T2D)关联;(二)不同GWAS之间与祖先相关的等位基因效应异质性(由遗传变异轴定义);以及(三)不同GWAS之间的残余等位基因效应异质性。
  1. MR-MEGA是一种元回归方法,因此不产生等位基因效应估计,因为这种效应允许随遗传变异轴变化。
  1. 因此,我们还通过固定效应元分析(等位基因效应的逆方差加权)使用METAL64聚合了跨GWAS的关联汇总统计。
  1. 为了评估GWAS之间的残余结构程度,我们计算了多祖先元回归和固定效应元分析的基因组控制膨胀因子。
  1. 我们仅考虑那些在至少五个GWAS中报告的SNV进行下游分析。

Defining T2D signals and loci

定义2型糖尿病信号和位点

Para_01

  1. 我们识别了所有在多祖先元回归分析中达到全基因组显著水平(P < 5 × 10−8)的与2型糖尿病(T2D)相关的单核苷酸变异(SNV)。
  1. 围绕索引变异形成了聚类,这些索引变异是使用PLINK v.1.9(参考文献66)中的贪婪算法选择的,在按P值升序排列SNV之后。
  1. 距离索引SNV小于5 Mb的SNV,如果在1000基因组项目(第3阶段,2014年10月发布)54中的至少一个五大洲群体中r2 > 0.05,则被分配到该聚类中。
  1. 距离小于1 Mb的索引SNV被分配到同一基因座。
  1. 每个基因座随后被定义为映射到包含在其内的索引SNV上下游各500 kb的区域。
  1. 如果基因座包含在已发表的大规模T2D全基因组关联研究(GWAS)中发现的达到全基因组显著水平的变异,我们认为该基因座已被先前报道。

Ancestry-group-specific meta-analyses

祖先群体特异性元分析

Para_01

  1. 我们通过固定效应元分析(等位基因效应的逆方差加权)使用METAL64汇总了同一祖先群体中GWAS的关联总结统计量。
  1. 我们估计了每个祖先群体中GWAS的平均效应等位基因频率,按研究的有效样本大小进行加权。
  1. 我们使用R包meta( https://cran.r-project.org/package=meta/ )生成了跨祖先群体的索引SNV关联总结统计量的森林图。

Defining clusters of T2D index SNVs with distinct cardiometabolic profiles

定义具有不同心血管代谢特征的2型糖尿病指数单核苷酸变异聚类

Para_01

  1. 我们考虑了用于定义2型糖尿病(T2D)状态和/或与T2D风险或并发症相关的 cardiometabolic-related 定量表型。
  1. 我们排除了只有在通过国际HapMap项目67的参考面板进行插补后才能获得的GWAS汇总统计的表型,因为它们没有提供足够覆盖包含在多祖先元分析中的SNV。
  1. 我们考虑了最大的可用GWAS元分析(特定祖先或多祖先),它为每个SNV提供了以下关联汇总统计:效应等位基因、其他等位基因、等位效应和相应的标准误(补充表5)。
  1. 我们将效应估计重新对齐到来自固定效应多祖先元分析的T2D风险等位基因,表示为βij,其中j是第j个索引SNV,i是第i个表型。
  1. 然后我们计算了一个样本量校正的z分数,公式为Zij=βij/(√Ni * sij),其中sij是第j个索引SNV和第i个表型效应估计的标准误,Ni是报告的第i个表型的最大样本量。
  1. 在未报告关联汇总统计的情况下,z分数被设置为‘缺失’。

Para_02

  1. 我们对索引单核苷酸变异(SNVs)进行了k-means聚类,使用R包ClustImpute( https://cran.r-project.org/package=ClustImpute )对缺失的z分数进行了插补。
  1. 对于预定义的簇数,ClustImpute在第一次迭代中从表型的边际分布中随机替换缺失的z分数,并进行k-means聚类。
  1. 在后续迭代中,缺失的z分数根据当前簇分配进行更新,以便考虑表型之间的相关性。
  1. 在每次迭代中,对插补值施加惩罚权重,并随着缺失数据插补的改善逐步减少(至零)。
  1. 最后,我们根据27个簇性能指数的多数规则确定了"最优"簇数,该规则在R包NbClust( https://cran.r-project.org/package=NbClust )中实现。

Para_04

  1. 我们从ClustImpute最终插补数据集中提取了心血管代谢表型z分数。
  1. 我们计算了第j个SNV与第k个聚类中心的欧几里得距离,如下所示:

Para_05

  1. 其中,Zij 和 μik 分别是第 j 个单核苷酸变异的 z 分数和第 i 个心血管代谢表型的第 k 个聚类中心的坐标。
  1. 为了评估聚类差异,我们还使用 R 包 factoextra( https://cran.r-project.org/package=factoextra )对最终插补数据集中的心血管代谢表型 z 分数进行了主成分分析。

Cluster-specific associations of index SNVs with T2D

特定集群的索引SNV与2型糖尿病的关联

Enrichment of T2D associations for cell-type-specific regions of open chromatin within clusters

在聚类内开放染色质的细胞类型特异性区域中,T2D关联的富集

Para_01

  1. 对于每个2型糖尿病关联信号,我们定义了‘空’单核苷酸变异(SNV),这些变异映射在索引SNV的50千碱基范围内,并且在与1000基因组项目(第三阶段,2014年10月发布)的五个大陆群体中的任何一个中都不与索引SNV处于连锁不平衡状态(r2 > 0.05)。
  1. 我们定义了一个指示变量Yj,如果第j个SNV是索引SNV,则取值为1;如果第j个SNV是空SNV,则取值为0。
  1. 我们将索引SNV和空SNV映射到由Ensembl项目(第104版)定义的基因区域,包括蛋白质编码外显子、3′非翻译区和5′非翻译区。

我们定义了指示变量

2型糖尿病 (425)
肥胖症 (62)
糖尿病性胰岛素抵抗 (18)
代谢综合症 (6)
脂肪营养不良

最后编辑于 2024-10-12 · 浏览 523

回复1 3

全部讨论0

默认最新
avatar
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部