用罕见病病例击穿AI大模型的思考假象
开启深度思考🤔,AI根据临床体征和实验室检查/影像学检查数据推理得头头是道,而剖开大语言模型(LLM)的“大脑”Transformer,AI医生只不过是在猜测下一个词最大概率要说什么。
将患者的真实病例报告交给AI医生(以deepseek为例),看看他是如何“思考”,如何“看病”吧。
本次真实临床案例来源于 @上海交通大学医学院附属瑞金医院 神经内科 何璐 ,更多案例细节及讨论,请至 @医院汇 老师,原贴 https://www.dxy.cn/bbs/newweb/pc/post/48299518?sf=1&sr=1 了解。
病例内容:
患者:66 岁,女性。
简要病史:低热、乏力 4 月,认知障碍2月,加重伴步态异常、便秘、尿潴留1月。近1月反应慢,寡言少语,言语逻辑错乱,烦躁易怒,行走不稳,无家人照看时反复摔倒,言语不清、饮水呛咳,排尿困难、便秘,无幻觉,无精神行为异常。既往高血压10年、糖尿病4月。
查体:定位定向力下降,记忆力、注意力下降,失算,手指失认,左右失定向,结构性失用,四肢图形辨别觉差,执行功能障碍,MMSE 评分8分(满分30分)。存在中度构音障碍和严重小脑性共济失调,共济失调(SARA)评分为 27,患者自行无法站立。存在自主神经功能障碍:直立性低血压,仰卧20分钟血压148/84 mmHg,站立3min血压 88/58 mmHg;严重尿潴留,残余尿量为105mL,需留置导尿。存在椎体外系症状:帕金森综合征表现,包括面具脸、眉心征(+)、运动迟缓、双上肢齿轮样肌张力增高,统一帕金森病评定量表 (UPDRS) 第 II 部分得分 25,UPDRS 第 III 部分得分为41。锥体系:反射检查提示双侧二头肌反射和膝反射亢进,双侧巴宾斯基征阳性。其余颅神经、肌力、感觉无明显异常。mRS评分5分。
常规血液检查均在正常范围内。

头颅MRI示大脑半球、小脑和内侧颞叶中度容量丢失
全身18F-FDG-PET筛查恶性肿瘤阴性。
腰椎穿刺提示脑脊液细胞增多(8*10^6/L)、正常葡萄糖(3.9 mmol/L) 和蛋白水平 (343 mg/L)。
IgG 寡克隆条带阴性,二代测序阴性,无感染证据。
副肿瘤和自身免疫性脑炎相关组合(抗-Hu, Ri, ANNA-3, Yo, Ma2/Ta, GAD65, CV2, Amphiphysin, SOX1, Titin, NMDAR, AMPAR, DPPX, CASPR2, LGI1, GABAbR和IgLON5抗体)均为阴性。
🤖 首先AI快速总结了核心临床特征:
1. 快速进展性神经功能障碍(4个月内从低热乏力→认知障碍→全面神经功能崩溃)
2. 多系统神经损害:
认知功能:重度痴呆(MMSE 8分),顶叶功能受损(失算、失认、失用)
运动系统:小脑性共济失调(SARA 27分,无法站立)。帕金森综合征(肌张力增高、运动迟缓,UPDRS-III 41分)。锥体束征(病理反射阳性)。
自主神经衰竭:直立性低血压(ΔBP>60/26 mmHg)、尿潴留、便秘
3. 辅助检查关键点:
MRI:广泛脑萎缩(大脑、小脑、颞叶)
脑脊液:轻度细胞增多(8/μL)、蛋白升高(343mg/L)
排除性检查阴性:
恶性肿瘤(PET阴性)、自身免疫/副肿瘤性脑炎(全抗体阴性)、感染(二代测序阴性)
💊对于复杂且繁多的报告内容,AI能够很好的快速提炼重点,但对于病例报告的总结,AI会出现仅凭单一的临床指征快速下定义,比如凭借症状判断病理状况,这看起来过于果断和大胆。
那AI医生又是如何推理的呢?
🤖令人惊讶的是,在此病例中,AI首先对病变位置进行了定位,然后得出大致疾病方向。
AI认为病例提示患者发生累及全脑的弥漫性病变:
认知障碍(皮层)、帕金森征(基底节/黑质)、共济失调(小脑) 、病理征(锥体束)、血压/膀胱失控(自主神经)。
因此需要考虑神经变性病或朊蛋白病。
随后,AI根据快速进展期,猜测朊蛋白病(如克雅病)或恶性自身免疫性疾病。但由于相关抗体为阴性,排除自身免疫性疾病。
🚫自身免疫性脑炎阴性通常指通过血液或脑脊液检测未发现已知的特异性自身抗体,但这不意味着完全排除疾病,需结合临床症状、影像学及治疗效果综合判断。
💊虽然AI的推理逻辑与常规临床诊断不一致,但从他提出的可能性来看,他能够快速通过临床表现找出相对应的疾病,该病例本身存在较大难度,在临床诊断中同样具有挑战性。其次,受算法影响,AI通常会忽视低概率的可能性,因此忽视抗体阴性自身免疫性疾病。过早下定论。
⚠️真实临床疾病诊断往往是根据患者的症状、体征、病史、实验室检查和影像学检查等信息,结合专业知识,对病情进行判断和鉴别,并为后续的治疗提供依据。
最后,AI陷入了疾病反证明的陷阱。在得出朊蛋白病的初步论证后,AI通过临床表现进一步验证结论的可靠性。同时由 帕金森征+病理征 推论 锥体外系+椎体系混合征,得出 肌阵挛 结论。从而使其符合克雅病(CJD)的三联征经典表现。
不过,AI显然明白,如果想要真正下结论(确诊),还缺乏一些有效的相关检查。因此,建议紧急完善脑脊液14-3-3蛋白、RT-QuIC及DWI-MRI。
🤔那临床医生是如何处理呢?不得不说,拥有丰富临床经验的真实医生,往往更加灵活。
治疗过程如下:
患者老年女性,急性-亚急性起病,表现为快速进展性痴呆、双侧小脑性共济失调、伴锥体外系、锥体系、自主神经功能受累,磁共振仅见萎缩未见明显高信号病灶,根据起病形式考虑免疫性可能性大(自身免疫性脑炎、副肿瘤性脑炎等),但变性病MSA等不能排除。
经验性给予甲泼尼龙冲击治疗(500mg,持续5天,继予口服醋酸泼尼松(1mg/kg/d开始,每2周减5mg),静脉注射免疫球蛋白(IVlg,0.4g/kg/d,持续5天)。治疗后患者共济失调和记忆力逐步改善,,能够在帮助下行走。共济失调(SARA)得分为24, UPDRS-II得分为22, UPDRS-I得分为36。排尿功能恢复,拔出导尿管后患者出院。
随访1年后,患者整体症状有所改善。由于患者免疫治疗有效,高度怀疑自身免疫性脑炎,送检血液和脑脊液TBA,检测均为阳性,特别是在小脑浦肯野细胞、小脑颗粒细胞、海马等区域出现显著的阳性荧光信号。因此进一步利用CBA法拓展筛查范围更广的小脑、自免脑相关的抗原-抗体谱,重点关注在小脑浦肯野细胞表达丰度高的抗原。最终发现该患者血液、脑脊液样本SEZ6L2抗体均为强阳性。
📚其实,该患者为SEZ6L2抗体相关性脑炎,你猜到了吗?全球仅8例的罕见病。
(更多细节,包括检测报告、鉴别诊断、相关知识点学习等,请到原贴了解)
👀结合另一病例《异病同象:难以鉴别的自身免疫性脑炎和克雅病 》,展现了诊断是一个循证的过程,诊疗的过程需要始终以患者为中心,为患者选择以最小代价获取最大效果的诊疗方案。
以下内容摘自该病例:
VGKC 抗体脑炎(或其他自身免疫性脑炎)和 CJD 可以有相似的临床,影像学,电生理以及实验室检查特点。但一般来说快速进行性痴呆伴局灶性神经功能缺损,如失语,步态异常和视觉障碍等提示 CJD 的可能性大,而癫痫发作,低钠血症和自主神经症状的出现则是自身免疫性脑炎的诊断线索。CJD 是一种致死性疾病,而 VGKC 抗体脑炎(或其他自身免疫性脑炎)绝大多数可治,尽早行抗体检测或可早期诊断,尽早开始免疫抑制疗法或可降低致残率和致死率。
临床上碰到快速进展性痴呆的患者,在诊断 CJD 前需考虑并排除可治性疾病,例如自身免疫性脑炎,特别是 VGKC 抗体脑炎。诊断 CJD 意味着给患者判了死刑,因此一定要慎重。在尚不能明确病因时,可考虑经验性开始一些可治性鉴别疾病的治疗,因为某些可治性痴呆早期干预可能改善患者预后。
对于任何免疫抑制治疗无效的快速进展性痴呆,即便神经元抗体阳性,也应重新评估是否为 CJD。需复查脑脊液,头颅 MRI,脑电图,甚至活检明确。
🐋 嗯,AI在训练时“学习”过海量包含医疗信息的文本,也“学习”了怎样像医生一样讲话。ta应该是一个猜词的学霸,还是一位接词的高手。虽然有时候“思维”过于发散,但题海战术往往能够答对大部分题目。
我还让AI诊断过一例罕见病,ta快速的抓到了巨脾这一显著体征,并且很喜欢用三联征来验证。在排除常见疾病之后,得出戈谢病的结论。这说明在面对某些较为显著的特征时,ta能够找到与之强相关性的疾病。
Ta在全球仅有8例的罕见病解答过程中,并非天马行空的猜测,但对于症状和疾病之间关系的理解较为单一,并且缺乏灵活性和个性化。真正的临床医生不仅要懂复杂的医学知识,更要为患者的利益考虑。
那AI诊疗方案,医学伦理要不要也作为可计算参数呢?