随机森林模型在输卵管再通术后妊娠预测中的应用研究
不孕症是一种由多种病因导致的生育障碍状态,是生育期夫妇的生殖健康不良事件。女性无避孕性生活至少12个月而未孕称为不孕症。目前我国不孕症的发病率为7%~10%[1],且呈上升趋势,这为保护女性生育力、构建生育友好型社会带来了挑战。输卵管性不孕是导致不孕症的常见原因之一,据相关文献,其具体在不孕症中的占比因地区、研究方法及研究对象的不同波动在25%~35%[2-3]。输卵管性不孕的原因主要包括输卵管阻塞、输卵管粘连及输卵管积水。针对输卵管性不孕的主要方法为输卵管再通术及辅助生殖技术。尽管辅助生殖技术在许多不孕症患者中取得了成功,但其也存在一些潜在的缺点和风险,例如成本高昂、辅助生殖过程中患者的健康风险及身体、心理压力,以及其成功率受诸多因素影响,均限制了其应用。输卵管再通术是通过手术的方法针对输卵管阻塞、粘连及积水进行修复,恢复输卵管的通畅性及正常功能。相关文献报道输卵管再通术后成功妊娠的影响因素包括术前输卵管状况、术者的手术技术及患者一般情况等诸多方面[4-6]。目前对于多因素综合作用下输卵管再通术后妊娠影响因素的研究较少,且多采用传统的统计学方法,易出现过拟合、预测精度和效度低等问题[7]。本研究回顾性收集2016—2018年于首都医科大学附属北京世纪坛医院妇科进行的宫腹腔镜联合下输卵管再通术患者一般情况及术中输卵管情况,识别影响输卵管再通术后成功妊娠的高危因素,建立输卵管再通术后妊娠概率的预测模型,可指导临床决策。
1 资料与方法
1.1 研究对象
回顾性收集2016—2018年于首都医科大学附属北京世纪坛医院妇科进行的宫腹腔镜联合下输卵管再通术170例患者的病例资料,每例数据的病例资料及手术情况均准确及时地录入电子病历系统,并且内容经过三级医师制度进行审核,以保证录入数据的高度准确性。术后由经过培训的人员通过电话及门诊进行随访。纳入标准:(1)年龄21~48岁,符合输卵管阻塞性不孕诊断,签署知情同意书;(2)术前监测患者排卵功能无异常;(3)男方精液无异常。排除标准:(1)因输卵管结扎而导致近端输卵管阻塞者;(2)术后未规律随访者;(3)术后接受促排卵治疗、辅助生殖技术者;(4)合并严重内外科疾病,短时间内不宜妊娠患者。本研究经首都医科大学附属北京世纪坛医院伦理委员会审查通过[伦理审批号:sjtkyll-lx-2023(062)]。
1.2 宫腔镜联合腹腔镜输卵管再通术
手术适应证为确诊原发不孕或继发不孕的育龄期女性,术前经本院超声科行输卵管超声造影提示输卵管存在梗阻或通而不畅。输卵管超声造影检查由高年资、富有经验的超声科医师完成,所有输卵管再通术由同一位术者完成,以保证各项临床指标测量的均一性以及手术质量的可控性。输卵管再通术中根据术中所见及术中输卵管通液情况进行相应手术操作以恢复输卵管的通畅性,其中包括:输卵管导丝复通术及输卵管成形术。若术中探查发现输卵管或卵巢肿物,亦会进行肿物剥除。
1.3 观察指标
根据接受宫腔镜联合腹腔镜输卵管再通术后2年内是否自然妊娠(以超声确诊宫内孕为诊断标准)分为妊娠组(n=82)和未妊娠组(n=88)。观察两组术中操作包括是否进行附件(包括输卵管及卵巢)病损切除术、输卵管导丝复通术及输卵管成形术;统计两组患者临床资料,包括:年龄(岁)、不孕时间(年)、既往妊娠次数(次)、不孕类型(原发不孕/继发不孕)、痛经情况、是否合并瘢痕子宫病史、是否存在盆腔炎病史,以及宫腔镜、腹腔镜术中探查是否合并以下情况:子宫内膜异位症、卵巢子宫内膜异位囊肿(巧克力囊肿)、盆腔粘连、泡状附件、子宫内膜息肉。
1.4 统计学方法
采用R(Version 4.1.2)和RStudio(Version 1.4.1106)软件进行统计学分析,符合正态分布的计量资料以(x±s)表示,两组间比较采用t检验;非正态分布的计量资料采用M(P25,P75)表示,两组间比较采用非参数检验;计数资料采用频数(百分比)表示,组间比较采用χ2检验。在RStudio中运用Boruta包筛选危险因素,运用Random Forest包建立随机森林预测模型,绘制偏回归图、回归曲线,分别绘制训练集和测试集的受试者工作特征(receiver operating characteristic curve,ROC)曲线,分别建立训练集和测试集混淆矩阵。运用Bootstrap分别计算训练集、测试集的预测准确度和Kappa值。以P<0.05为差异有统计学意义。
2 结果
2.1 单因素分析
两组既往妊娠次数、子宫内膜异位症、子宫内膜异位囊肿、盆腔粘连、手术结局、子宫内膜息肉、瘢痕子宫、多囊卵巢综合征、盆腔炎病史、卵巢病损切除术、输卵管导丝复通术、输卵管成形术比较,差异均无统计学意义(P>0.05);两组年龄、不孕时间、不孕类型、痛经所占比例、泡状附件所占比例比较,差异均有统计学意义(P<0.05)。
2.2 特征变量的选取和随机森林模型的建立
本研究结局变量是指患者在接受输卵管再通术后2年内是否自然妊娠(赋值:未妊娠=0,妊娠=1),解释变量为一系列可能影响自然妊娠的因素,包括:患者年龄(赋值:连续变量)、不孕时间(赋值:连续变量)、既往妊娠次数(赋值:连续变量)、不孕类型(赋值:原发不孕=0,继发不孕=1)、是否存在子宫内膜异位症(赋值:否=0,是=1)、是否存在子宫内膜异位囊肿(赋值:否=0,是=1)、是否存在痛经(赋值:否=0,是=1)、是否存在泡状附件(赋值:否=0,是=1)、手术结局(赋值:双侧不通=0,单侧不通=1,双侧畅通=2)、是否进行输卵管成形术(赋值:否=0,是=1)、是否进行输卵管导丝复通术(赋值:否=0,是=1)、是否存在盆腔炎病史(赋值:否=0,是=1)、是否存在盆腔粘连(赋值:否=0,是=1)、是否进行卵巢病损切除术(赋值:否=0,是=1)、是否存在子宫内膜息肉(赋值:否=0,是=1)、是否为瘢痕子宫(赋值:否=0,是=1)。建立随机森林模型的步骤如下:被筛选后的变量,多囊卵巢综合征这一特征被排除在外。在随机森林模型的建立过程中,涉及的参数主要包括ntree和mtry。采用Bootstrap自助法抽取63.2%(108例)数据建立随机森林训练模型,设置不同参数下的随机森林模型并在测试集验证,发现当ntree=500,mtry=4时,随机森林模型的预测效果最佳,预测准确度为87.1%、灵敏度为93.1%、特异度为81.8%、阳性预测值为81.8%、阴性预测值为93.1%、曲线下面积(AUC)为0.921。变量的重要性评分越高表示该变量的应用能力越强,其中不孕时间为最重要的自变量。通过相关计算,该随机森林模型的袋外误差率(estimate of error rate,OOB)为15.74%。
2.3 随机森林模型的验证
该预测模型的验证主要基于模型的区分度和校准度,分别绘制训练集和测试集的ROC曲线,并计算AUC来评估模型的区分度,训练集的AUC为1.000,测试集的AUC为0.921,表明该预测模型具有较好的判别能力。另外,训练集和测试集的校准曲线显示了尚可的一致性,测试集的Brier评分为13.3(95%CI=9.6~17.0)。Bootstrap计算训练集和测试集的预测准确度为1.000及0.871,Kappa值为1.000及0.743,精确率为1.000及0.818,召回率为1.000及0.931,F1值为1.000及0.871。说明模型具有较高的准确度和中等的稳定性。
3 讨论
本研究采取R语言建立预测模型,在建立模型中将数据分为训练集和测试集,并使用组合采样来解决样本不均衡问题带来的影响,进而实现了模型的内外部建立、验证。在特征变量的筛选中,Boruta算法首先对原始数据集进行重复并打乱每列中的值(重排后的数据集称为shadow features),并在这些数据集上训练随机森林分类器,获得数据集中所有变量的重要性得分。随后,比较来自原始数据计算的变量重要性得分是否优于shadow features计算的变量重要性得分。该过程重复N次,通过N次迭代比较后即可确定变量的重要性排名,以及将不重要的变量剔除[8]。随机森林本质上属于机器学习的一大分支——集成学习,是一种特殊的bagging方法,是通过许多棵决策树对数据进行综合分类,关联性检验、预测和解释[9],其特点是具有优秀的准确度、有效地运行大数据集、处理高维特征的输入样本、提供特征的重要性、获取到内部生成误差的无偏估计、平衡不均衡的资料误差和有效处理共线性问题[10]。而ROC曲线可以很直观和形象地呈现模型的区分度,同时机器学习中的混淆矩阵也能够很快地帮助分析两类问题的灵敏度、特异度、阳性预测值和阴性预测值的误分情况,综合评价预测模型的优劣[11-12]。近年来,随机森林算法在疾病风险、预测、预警和预后中广泛应用,其能对医学数据中的混杂数据、离群值进行有效的处理,不易出现过拟合,预测精度也较准确[13-14]。
由于手术技巧、手术方式、样本含量以及评估工具等差异,研究报道不同地区的输卵管再通术后妊娠率亦存在差异。国内有学者对比输卵管再通术联合碘油灌注与常规输卵管再通术的疗效差异,结果发现碘油灌注可明显提高妊娠率,缩短术后妊娠所需时间[15]。但由于碘油提高输卵管再通术后患者妊娠率的作用机制尚不完全清楚,本机构目前未采用术中碘油灌注。亦有学者通过Logistic回归分析探索输卵管再通术后影响妊娠的因素,发现女性年龄、抗缪勒管激素(AMH)水平均为影响术后成功妊娠的独立危险因素[16]。本研究纳入研究时未统计患者的AMH水平,但也发现女性年龄为术后妊娠的独立风险因素,且患者的AMH水平与年龄密切相关。此外,本研究还发现既往妊娠次数及不孕时间亦对术后妊娠有影响。对于大部分针对输卵管再通术后妊娠的研究随访时间较短,通常仅为1年。本研究随访时间为2年,能更准确地调查患者接受输卵管再通术后成功妊娠的情况。与其他研究相比,本研究中所有输卵管再通术均为同一术者完成,进一步保证了手术质量的均一性,避免了因手术技巧不同对研究结果带来的混杂影响,因此研究结果更加准确可靠。
本研究采用平均预测精度下降量对输卵管再通术后妊娠预测的随机森林模型中影响因素的重要程度进行排序,发现术前不孕时间及年龄对术后妊娠概率影响最大。对于输卵管性不孕,无论其为原发性或继发性,术前不孕时间越长,提示输卵管的病变程度越重,比如存在粘连、水肿及梗阻,从而影响精子与卵细胞的结合。女性的最佳生育年龄为25~30岁,30岁之后随着年龄的增长生育能力呈现下降趋势。通过建立此随机森林预测模型,在临床实践中,针对不孕时间长且年龄较大的不孕女性,由于其接受输卵管再通术后妊娠概率较低,可直接通过辅助生殖进行妊娠。这样既减少了患者的经济负担,缩短了其备孕时间,亦减轻了其心理负担。
本研究通过随机森林算法构建输卵管再通术后妊娠概率的预测模型并进行验证,分析了可能与术后妊娠概率的相关因素。随机森林定量估计各因素对术后妊娠的影响,有助于识别输卵管再通术后的获益人群,在临床决策中作为指导,以术后获益为参考对患者进行术前分流。若患者接受输卵管再通术后获益不明确,应尽早进行辅助生殖,减少患者的心理及经济负担。随机森林算法建模的过程是不断进行重复抽样、随机选择和分类决策,无法看清其建立模型过程的内部结构,所以对于变量间的解释较为困难。因此,下一步计划将传统的统计学方法和随机森林等多种算法进行融合,提高输卵管再通术后影响妊娠变量的解释程度。
在随机森林中,过拟合是一个重要的问题,尽管随机森林相对于单个决策树有一定的鲁棒性,但仍然需要考虑如何应对过拟合。增加随机森林中树的数量可以降低模型的方差,从而减少过拟合的风险。通常来说,随机森林中的树越多,模型的性能和鲁棒性越好。本研究中,设置不同参数下的随机森林模型并在测试集上验证,发现当ntree=500,mtry=4时,随机森林模型的预测效果最佳,并依此得出结论。外部验证是一种用于解决随机森林中模型过拟合问题的有用工具。随机森林通过引入随机性来降低过拟合的风险,而外部验证则是一种内置于随机森林训练过程中的交叉验证技术,用于评估模型的性能并检测过拟合情况。该随机森林模型的OOB为15.74%,较低的OOB通常表示模型的泛化能力较好。
本研究还存在一定的局限性:一是没有对术后到妊娠间隔的时间进行分层分析,后续将进一步建立大样本量的妊娠率个体化列线图预测模型进行验证。二是本研究为一项回顾性研究,未来还需要更多前瞻性、多中心、大样本量的研究来验证其可行性。进行数据分析时,随机森林通常对小样本数据表现出相对较好的鲁棒性。这意味着即使数据集的样本数量相对较少,随机森林仍然能够构建稳健的模型,而不容易过拟合。其可以在相对小的样本集上表现良好,但更大的样本量通常会提供更好的结果。在未来的研究中,将全面、综合考虑各类影响,扩大纳入研究的影响因素,以建立更精准科学的预测模型,为临床决策做出更可靠的指导。
参考文献略
最后编辑于 02-12 · 浏览 1155