微生态研究在临床能干什么?
查看病例
先举个例子—量体温,病人的口腔或腋下放上温度计后可以得到体温信息,基于这个信息,医生判断这个病人是否出现体温异常,结合其他的信息和临床经验,做出进一步的医疗决策,比如做病原化验,更换药物等。
微生态与量体温,在本质上是一样的,都是通过借助仪器,得到的人体局部信息,以辅助临床决策。微生态研究的对象是环境中(粪便标本,体液标本,病房,手术器械表面等),所有病毒,细菌,真菌,寄生虫等微生物的总和。微生态研究的数据结合样本信息后(疾病状态,生理生化特征等),通过数据分析得到微生态信息,研究者使用这些信息进行临床决策(或发表论文)。
图1 信息流-微生态研究和量体温
微生态研究的新方法——高通量测序及信息分析,对于大多数刚开始接触这一块的研究者们来说,可能是一个特别深奥乃至无法理解的新方法!这些其实都不是事儿,你拿到CT报告后,会把CT仪器拆开研究下吗?当然不会,只需要知道影像结果和受试者疾病之间的关系即可。同理,对于做微生态研究的临床医生和研究者来说,各种陌生词汇,如基因组测序、生物信息学等,只是“获得信息的方式”。研究者才是决定“这些信息是否有价值”的主宰,所以只需关注一个点:“这些信息对我有什么用”,不要过度纠结数据产生和分析的过程。
如果你看不懂数据分析人员提供的信息,不是你的责任,而是他们展示信息的能力太差。好的数据分析结果提供的信息,会清晰,简单,无废话。研究者的宝贵时间要用于阅读文献,建立微生态信息和疾病之间的关系,这是决定研究成果档次最关键的部分,没有人比你更了解你所在的领域,而数据分析和测序只能协助你,但不能完全代替你完成这部分工作。
先谈下微生态研究提供的三种信息: 1)有哪些微生物,有多少。2)环境中微生物的功能。3)不同微生物之间的关系。
1 有多少种类和数量的微生物?
可以看到环境中所有微生物的组成以及他们的比例,因为传统的实验室分离培养只能得到常见的微生物,而99%的微生物无法得到体外纯培养物。测序富集到微生物(不考虑微生物是否仍然存活)后,直接提取基因组序列,不需要培养,因此可以得到更全的信息。更重要的是,测序分析还可以观察到未知的,从没有人发现过的微生物,下次谈到高通量测序时我们再说其原理。
PS:微生态研究只能得到微生物的比例,而不是绝对个数。比如,我们从所有微生物中,观察了100个细菌,有10个菌是双歧杆菌,我们就可以说双歧杆菌占了10%,而不能说这个环境中有10个双歧杆菌。仅仅依靠基因组测序的微生态研究,不能做到绝对定量。
2 微生物做什么。
拿到所有微生物的基因组测序分析后,可以得到很多基因(如何得到?下次再说),如果能知道这些基因做什么,参与了哪些代谢反应,就能推测所有的微生物在做什么。推测"这些基因具有什么功能"的术语叫做注释(annotation),有现成的工具来干这个活。一般使用NCBI的COG数据库,里面收录的基因的功能都经过实验证实,所以相对于其他数据库的结果更加可靠。虽然数据库中的基因已经达到了几百万个,但常见的基因功能分类就20多种而已。COG在2003年第一次公开数据,第二次更新是2015年。这十年中,微生物基因组的数量从几百株增加到了5万多株(2015年一年内就增加了2万株),微生物基因组的注释工作,基本都会使用到 COG数据库,10年间竟然没有一个公认的可替代的数据库出现,可见COG数据库十分难做,非常可靠。(向COG 致敬!)
图2 COG的功能组成,字母缩写代表一类功能,大部分基因的功能(S,R)都是未知。
3 微生物之间的关系。
噬菌体捕食细菌的特异性非常强(体外实验可以证实),大量的研究都证实益生菌有抑制外来病原菌和发病过程的能力。第一个问题:怎么从几千个微生物,找到类似噬菌体和益生菌这种有潜在价值的微生物?
这需要先用到统计学,找到与病原体相关的细菌或者噬菌体。举个例子,假设我们要寻找能杀灭病原菌P的微生物,我们首先需要计算所有的微生物,和这个病原菌之间的相关性。如果在所有的样品中,病原菌A越多,微生物B越少(同时这个病原菌越少,而这种微生物B越多)。这时,A和B就可能存在对抗关系。常见的微生物之间的关系只有8种,如下图所示。我们一般最关心的是捕食/寄生(Parasitism/predation)和共生(Mutualism)。共生也很有用,有些微生物必须要有共生体才能生存(体外分离培养的基础)。从数据上显示就是,如果样品中没有微生物A,也就不会有微生物B。下一步的工作就是得到感兴趣的微生物的纯培养物,做体外实验以证明他们确实有抑制病原体,或者抑制发病进程的能力。
图3 微生物之间的相互关系
小结
1 微生态提供信息,这些信息可以用于临床决策。
2 微生态的信息主要有三种:环境中有哪些微生物?他们有哪些功能?他们之间如何相互作用。
3 并不是有了高通量测序,才有了微生态研究。早期的研究是分离培养技术,后来发展到扩增靶基因转染质粒测序,再后来我们才广泛使用高通量测序进行微生态研究,在后续的分享中会讲到:为什么要用高通量测序做微生态研究。
4 研究者要把主要时间花在:阅读文献,建立微生态信息和疾病之间的关系。这是决定研究成果水平高低最关键的部分。
————————————————————————————————————————
很多临床医生质疑:花那么多钱和时间,微生态研究能让我的病人早点康复吗?很遗憾,目前看到的微生态研究结果(即使发表在nature/science的论文),对解决临床实际问题毫无帮助。究其原因有两个:
1 临床病人不单只有一个疾病因素。举个例子,糖尿病研究中,我们想了解哪些肠道菌群与空腹血糖浓度相关,可以找到一组初发糖尿病人,并确认健康对照的体重年龄和糖尿病人无偏差(假定健康组非常健康)。为保证两组之间尽可能只有糖尿病一个差异,还需确定疾病组没有高血压,脂肪肝等因素。科研纳入研究的对象存在选择偏好,和临床面对的病人完全不同。临床实践中的糖尿病人会有很多其他症状,比如肥胖,脂肪肝。临床和科研面对的受试者组成完全不同。要解决这个问题,可以把研究分成两个阶段:第一期,将严格挑选得到的样本进行测序分析得到结论;第二期,从门诊找一批没有筛选,随机挑选的糖尿病人,用他们的样本同样进行测序和分析。如果两个阶段得到的分析结果一致,则说明结论可靠,也就有了走向临床运用的基础。。
2 研究者没有提出临床问题。微生态领域有两个项目的影响力很大,美国的Human Microbiome Project I (HMP1)以及欧洲的 MetaHit,发起者都是传统的微生物学家。他们设计之初,不是为了解决某个具体的临床问题,而是利用最新的研究工具,探索一个几乎未知的领域。在这些新知识的基础上,HMP第二期 (HMP2) 启动了3个项目(http://www.hmp2.org/overview/;另外还可参见帖子:【资料】人类微生物组计划第二阶段-人类微生物组整合计划:人体健康与疾病期间微生物组-宿主组学数据的动态分析(【资料】人类微生物组计划第二阶段-人类微生物组整合计划:人体健康与疾病期间微生物组-宿主组学数据的动态分析)),包括:怀孕&早产,IBD肠炎,前驱糖尿病。如果项目的初衷是为了解决临床问题,一定要由熟悉临床的研究者主持,没有谁比临床医生更了解人类健康需面临的题。如果项目的初衷是产生描述性的知识,发表论文没有任何问题,但还需要更多的数据用于临床实践。
上面文章中介绍了微生态研究带来三种信息:1)微生物有哪些。2)微生物在干什么。3)微生物之间的关系。前两种信息可以关联到四种临床问题,注意每一种临床问题都有自己的适用范围。
一 病原诊断
微生态研究可以得到样品中所有细菌,病毒,真菌,寄生虫的信息。病原诊断适用于难分离到病原体的感染类疾病,比如神经中枢感染(脑脊液),未知原因发热(血清),尿路感染(尿液),腹膜炎(腹水)等,病灶通常是闭合性或者半开放性,正常情况下为无菌状态或者微生物组成很简单。有三个技术问题需要特别注意:
1 样品污染:要特别取样环境中存在的不相关微生物,解决方式是采集工具要严格消毒,取样同时用无菌蒸馏水制作阴性对照。
2 背景噪音:如果疾病的发病进程很快,我们会认为真正的病原菌大量繁殖占有绝对优势地位,但要注意样品中本身可能就有一些固定的和疾病无关的无害微生物,比如脑脊液中有无害病毒,尿液中会有来来自生殖道中的乳酸杆菌。解决方案:1)有阴性对照或不相关样品对照,用来鉴别无关微生物。2)结合病人的流行病史做出判断。
3 RNA病毒:有报道认为超过一半的腹泻和未知原因发热由RNA病毒引起,如打算做这方面的研究,就要在样品收集时要加入灭菌的RNA保护液,以便实验中提取RNA,因为RNA极易降解。
二 疾病诊断
大部分疾病的判定标准可以两类。1)数值性,如糖尿病(OGTT),肥胖(BMI),高血压。2)分类型,如癌症(病理或者影像),胃溃疡(胃镜)等。有些疾病分级和严重程度相关,如肝纤维化分级,比如肝癌,有多个信息:肿瘤的直径;基于肿瘤大小分的早,中晚期;原发或既发。
此类研究的目的是关联微生态菌群和疾病判断标准,以辅助甚至替代原有的诊断标准。分析流程如图4所示。
图4 疾病诊断的微生态研究
整个研究分为两个阶段。发现:用严格匹配无偏差的样品得到差异;验证:用新纳入的随机样品进行验证,并判定验证的准确率。此类研究的适用范围为:疾病的判定手段对病人有创伤,成本高,或者需要经验很丰富的医生。举个例子,肝纤维化分级,如果肠道微生态检查可以辅助甚至替代肝穿,就非常有价值,再比如早期结直肠癌肿瘤,如果粪便微生态能辅助肠镜,受试者也会愿意使用。如果现有的诊断手段简单易行可靠,就没必要用微生态做疾病判定,比如糖尿病,肥胖等,此类疾病可从侧重于微生态菌群的功能组成和发病机制关联,但这更偏向基础型研究,和临床使用很远。
三 风险预测,
风险预测和上面提到的疾病诊断完全是两个概念。
风险预测:根据现在的信息,预测受试者将来可能的疾病风险。比如受试者发现自己有BRC1 基因,觉得以后可能会发展为乳腺癌,会要求医生给她切掉,但她此时没有患癌,一般的临床医生可能也不会主动建议病人作出选择。
疾病诊断:根据现在的信息,判断受试者现在的疾病状态。比如医生根据喉部CT平扫,判断病人此时是否罹患食道癌。
如果某类疾病有高风险,但仍未发病的人群,比如IGT和糖尿病,HP感染者和胃癌等,就适合做这类研究,但要注意这类研究的周期很长,比如肝硬化发展成肝癌是一个很长期的过程,一定要等到同一个个体发展成疾病状态,才算完成样品收集。解决方案是要先纳入大量的样品并定期随访,挑选最后患疾个体做数据分析。用微生态研究预测疾病风险非常有趣,发高影响因子论文的可能性很大。但是要注意即使知道了风险,还需要开发出预防手段,这也是一个研究方向。举个例子,我们用肠道菌群预测受试者罹患糖尿病的可能性,假设我们得到的风险是90%(还有个问题,他什么时候会得糖尿病?),但受试者目前血糖正常,不可能按照糖尿病的标准治疗,这就需要新的药物或治疗手段。
四 个性化用药
由于个体之间差异很大,标准治疗方案不一定对所有人群都有效。微生态研究可以辅助临床医生制定出最优治疗策略,图5是此类研究的研究流程,我们只纳入了单个治疗方案,实际研究中可以纳入多个方案,并需要纳入阴性对照(不做任何医疗处理),以观察人体对此类疾病是否有自愈能力。
图5 个性化用药/治疗的微生态研究流程
研究目标很明确,用病人治疗前的微生态数据,预测治疗方案是否对受试者有效。整个实验分为两个周期。发现:纳入受试者后,先收集治疗前的样品,然后使用治疗方案,经过一段时间后(明确好时间,比如1个月或3个月),用预后评估,评价治疗方案对受试者的有效程度,然后将受试者分为“有效”和“无效”两组,寻找他们之间的差异。如果能启动新的研究,整合入新的治疗方案,比如另一种降血糖药物,抗肿瘤药物等,就能建成完整的数据库用于临床实际,用于辅助临床医生构建最佳治疗方案。有几个细节要注意:
1 一定要明确好“有效”和“无效”的定义,而且有些“有效”是可以量化的,比如降血糖的程度,体重下降的程度等。数据类型不同,数据分析方法也不同。可以参考我们在上一小节中对“疾病状态判定”的理解。
2 此类研究最大的难点在于病人征集和随访。要花很多时间招募受试者并随机分为不同的治疗组。
3 因为是随机选择,治疗方案不一定最适合受试者,不能根据自己的临床经验随意增减纳入者,这样会带来很大的偏差。解决方案:要有多个治疗方案备选,对受试者可能有较大副作用的可以提前删去。
4 在治疗过程中,要有专人定期随访受试者的饮食和用药记录,最好要求受试者不要有地理迁徙和大的饮食结构变动。
小结:
1用新的临床样品,甚至背景状态非常混乱的样品,能否得到证实已有的结论,走向临床实际运用的第一步。
2 研究者没有临床问题,就不可能解决临床问题。
3 微生态研究提供的大量信息,并不是对所有的疾病都有用。每种疾病都有自己的特点,研究者要明确“我想要什么”,再去做实验设计。
4 测序成本高,周期长,是制约走向临床使用的一个大瓶颈。但科技发展的一个趋势是,有生命力的产品随着研发经费的投入会更便宜快捷。
作者:李昂 / 邮箱:LIA@ZJU.EDU.CN
合并后稍有编辑
最后编辑于 2022-10-09 · 浏览 1.8 万