中国农村订单定向医学生的教育研究评价:一项系统综述
长期以来,卫生人力的短缺和分布不当是包括欧美等发达国家在内的全球性公共卫生问题,在农村地区尤为突出[1-6],有研究指出,优秀的卫生人才对提升农村医疗卫生服务能力和质量至关重要[7]。目前,在加拿大[8]、澳大利亚[9]和美国[10]等发达国家,以及印度[11]、泰国[12]等发展中国家,都已从医学教育入手,明确提出并开展了针对农村基层医生的培养项目或政策,对缓解农村地区医生短缺的问题取得一系列积极成效。
中国也面临类似挑战。为此,早在2010年我国就启动了“农村订单定向医学生免费培养项目”(以下简称项目),旨在为乡镇卫生院及以下的医疗卫生机构培养全科医疗卫生人才[13]。截至2023年,中央财政投入超过21亿元,在全国30多个省份培养了共8万余名定向医学生[14-16],且在未来持续推进并逐步扩大定向医学生培养规模[17-19]。
故在此基础上的各类研究也随着该项目的持续实施而逐年增长[20]。
回顾国外多项针对类似项目的医学教育研究,其在促进选择性招生政策[10]、服务承诺政策的制定[8-9,11]、经济激励措施的落实[10-12]和教育干预措施的实施[8-10,12]等方面,为农村基层医生的教育提供了理论和实践上的支持,进一步地提高了这类项目的吸引力、参与度和最终效果[7]。因此,我国定向医学生医学教育研究的现状和相关经验有待总结。然而,国内关于农村订单定向医学生培养的研究综述,大多集中在基于CiteSpace等可视化软件对研究热点和趋势的分析[20-22],侧重于对该领域研究的整体情况进行梳理,缺乏对具体培养模式和方法的深入探讨。同时,虽有对国外类似项目的综述[23-25],但对中国各院校培养模式、方法及其效果评价的综合性分析不足。因此,本研究采用系统综述[26]的方法,检索并分析相关文献,旨在了解我国农村订单定向医学生教育研究的现状、效果评价方法和指标,探讨该领域教育研究的发展现状、研究质量及未来趋势,为促进我国基层医疗卫生队伍建设提供研究依据。
1 研究方法
1.1 文献检索策略
本研究于2024年2—4月,在中国知网、万方数据知识服务平台、维普网、PubScholar公益学术平台、PubMed、Web of Science、Cochrane Library共7个中英文数据库,检索与农村订单定向医学生培养相关的公开发表的文献,采用以下词语组合进行检索:(1)与农村订单定向项目有关的,“定向”或“订单式”或“免费”,oriented、compulsory、rural area、remote area;(2)与医学生、全科医生相关的,“医学生”或“全科医生”或“医学毕业生”或“临床医生”,“medical graduate”“medical students”“general practitioners”“primary care physicians”;(3)与教育、培养相关的,“教育”或“教学”或“培养”或“培训”或“课程”,“education”“training”。发表语言限定为中、英语,发表时间限定为2010—2023年。各数据库具体检索式见附表1(扫描正文首页二维码获取)。另外,通过文献的参考文献检索到与主题相关的文献也纳入本研究中。
1.2 文献纳入与排除标准
纳入标准:(1)研究项目的实施过程及效果评价的文献;(2)培养阶段包括院校教育、住院医师规范化培训、继续医学教育;(3)研究类型为随机对照试验、其他对照试验等实证研究(即采用归纳法、侧重于通过实际数据来验证理论的研究范式,区别于采用演绎法、侧重构建和推导理论框架的理论研究);(4)在中国范围内开展的研究。
排除标准:(1)培养对象仅针对三年制专科定向医学生的研究;(2)研究内容仅关注培养方案的介绍和描述性评论等理论研究,未包含具体评价指标的研究,或仅报道相关评价指标,未详细描述培养方案或课程构建内容;(3)重复文献,即同一篇文献刊登在不同的期刊,或同研究内容在期刊和学位论文中均有报道,或同时收录于两个及以上数据库的研究(筛选时仅保留其中发表在权威核心期刊的文献);(4)非科研文献,包括政府公报、政府工作报告、会议纪要、新闻消息、新闻访谈等;(5)综述类文献,包括系统综述、Meta分析、描述性综述等;(6)无法获取全文的文献。
1.3 文献筛检、信息提取及质量控制
采用Zotero 7.0进行文献筛选和管理,首先去除重复的文献;再由两名研究者独立阅读标题和摘要,根据文献纳入标准去除不相关的文献;最后阅读剩余文献的全文,根据文献纳排标准确定最终纳入文献。如两研究者遇到分歧时,首先通过讨论尝试解决,讨论基于既定的纳入和排除标准以及文献的具体内容,目的是达成共识,如果讨论未能解决分歧,将再引入一名研究经验丰富的研究者作为第三方进行仲裁,提供决定性意见。
在正式进行文献筛选前进行一次预筛选,以确保文献纳入和排除标准的可靠性和稳定性。在去重后的文献中随机抽取5%由两名研究者独立进行筛选,包括阅读标题、摘要,以评估文献是否满足纳入和排除标准,并对两研究者的筛选结果进行核对和计算,如果两研究者之间的一致性较低(kappa值<0.8),则根据研究者的反馈优化文献纳入和排除标准,直至一致性达标。
文献信息提取表由两名研究者在随机10篇的纳入文献中起草和测试,并由研究团队反复修改。提取信息包括纳入文献的基本信息(题目、第一作者、发表时间、发表期刊、研究开展地区和机构),研究具体内容(研究类型、研究设计具体内容、评价方法柯式分级及具体内容),其中,柯氏分级(Kirkpatrick's four-level model of evaluation)是一套广泛应用在医疗教育领域的教学评价方法[27],将培训效果分为四级。Ⅰ级:反应层,学生对课程的满意度及评价。Ⅱ级:学习层,学生参加教学后态度、知识及技能的改变。Ⅲ级:行为层,教学对学生实际行为的改变。Ⅳ级:结果层,教学带来的机构改变或患者获益。
1.4 文献质量评价
为评估纳入文献的质量,使用国际上常用的医学教育研究评价工具医学教育研究质量评价表[28](The Medical Education Research Study Quality Instrument,MERSQI)和纽卡斯尔·渥太华量表-教育版[29](The Newcastle-ottawa Scale-education,NOS-E),对文献进行质量评价。MERSQI共6个方面10个条目:研究类型、样本(机构数、回答率)、数据类型、评价工具效度(结构效度、内容效度、校标效度)、数据分析(程度、合理性)、结局指标柯式分级,所有项目得分相加为总分,最高得分18分。NOS-E共5个方面6个条目:样本代表性、对照组选择、对照组可比性(随机、非随机)、失访、盲法,所有项目得分相加为总分,最高得分6分。两者得分均与文献质量呈正相关,各项目得分和总分单独展示。COOK等[30-31]的研究表明,两评价工具均有较好的评分者间信度,但在使用范围上其各有优劣,比如MERSQI适用于广泛的非定性研究,且具有明确的评分标准,但在评估比较研究时忽略了组间的盲法和可比性;NOS-E则侧重于非随机比较研究,其允许评价者在做出判断时整合更多的数据,这对于评估比较研究特别有价值,但其需要更多的评价者主观判断,这可能会增加误差的风险。而联合使用可以从不同角度评价方法学的不同方面,以达到更全面地评估医学教育研究质量的目的。
1.5 统计学方法
采用Microsoft Excel 2021建立数据集,提取、收集文献信息。本研究计数资料用相对数表示,计量资料以(x±s)表示。
2 结果
2.1 文献筛选流程及结果
初始检索获得相关文献3 158篇,去重后获得文献1 464篇,剔除不符合要求的文献1 427篇,最终纳入文献37篇,其中中文36篇,英文1篇。研究均在中国完成。文献筛选流程见图1。

2.2 纳入文献基本信息及文献质量评分
2.2.1 发表年份及期刊。2011—2019年平均每年发表研究1~2篇,从2021年开始,研究呈逐年上升趋势,2023年共发表10篇(27%)相关文献。发表在中文期刊的36篇文献中,仅1/5发表在核心期刊(7,19%);1篇发表在英文期刊,为科学引文索引(science citation index,SCI)期刊。
2.2.2 研究开展地区和机构。依据国家统计局对我国经济地带的划分标准[32],研究主要集中在西部地区(23篇,62%),其中广西壮族自治区(8篇,22%)和重庆市(6篇,16%)最多,其次是东部(6篇,16%)和中部(5篇,14%)地区,东北地区(3篇,8%)均在吉林省开展。所有研究在同一地区独立开展,且绝大多数在单机构开展,只有1项研究涉及同一地区多机构。具体分布情况见图2。

2.2.3 文献质量评分。对纳入的文献进行质量评价,MERSQI总分(10.4±2.4)分,最高分14.0分,其中样本机构数、评价工具效度、结局指标是影响低分的主要条目;NOS-E总分(2.5±1.5)分,最高分5.0分,其中对照组可比性、盲法是影响低分的主要条目。
2.3 纳入文献研究内容
2.3.1 研究类型。根据邹川等[33]对全科教育干预研究的分类,本研究中纳入文献的研究设计包括单组后测(8篇,22%)、单组前测-后测(3篇,8%)、对照前测-后测(17篇,46%)和随机对照后测(8篇,22%)、随机对照前测-后测(1篇,3%)。
2.3.2 所属教育阶段。绝大部分研究是围绕本科院校教育阶段(36篇,97%)开展的,其中1/5在见习、实习的临床阶段(9篇,24%),只有1项在毕业后教育/规范化培训阶段开展。
2.3.3 研究具体内容。为方便信息归类,将纳入文献的研究内容划分为三类:课程调整类,即该研究主要关注相应课程内容的增加、删减等调整,或新增专门针对农村、基层或全科的课程对定向医学生的影响;教学方法调整类,即该研究主要关注相应教学方法的增加、删减、混合等调整对定向医学生的影响;培养模式构建类,即该研究主要关注针对定向医学生构建的新培养模式对定向医学生的影响。
研究关注的内容依次是课程调整类(33篇,89%)、教学方法调整类(30篇,81%)、培养模式构建类(3篇,8%),其中,全部培养模式构建类研究(3篇,8%)和7项(19%)课程调整类研究提及有开设专门针对农村、基层或全科的课程。课程调整类的研究中,有3/4的理论课程调整(25篇,68%)和1/4的技能课程调整(8篇,22%);教学方法调整类的研究中,有3/5的单一教学方法调整(18篇,49%)和2/5的混合教学方法调整(12篇,32%),涉及网络辅助教学(12篇,32%)、基于问题的教学(problem-based learning,PBL)(8篇,22%)、翻转课堂教学模式(flipped class model)(7篇,19%)、基于案例的教学(cased-based learning,CBL)(6篇,16%)、角色扮演(role play)(5篇,14%)、基于团队的教学(team-based learning,TBL)(3篇,8%)、微课(3篇,8%)、标准化病人(standardize patients,SP)(2篇,5%)、工作坊(workshop)(1篇,3%)。
2.3.4 评价指标。研究使用的评价指标有课程评价(26篇,70%)、课程考核成绩(30篇,81%)、执业医师考核成绩(1篇,3%)、预期履约率(2篇,5%)、实际履约率(1篇,3%)、患者满意度(1篇,3%)。按照柯氏分级对研究结果的分级,大部分的研究都评估到了Ⅰ级(26篇,70%)和Ⅱ级(33篇,89%),仅少量研究评估了Ⅲ级(1篇,3%)和Ⅳ级(1篇,3%)。
3 讨论
自2010年起,我国推行的农村订单定向医学生免费培养项目在解决农村医疗人才匮乏方面取得了显著成效[34-35],有研究表明,定向医学生在实际工作中表现出色,为当地居民提供了高标准的医疗服务[36]。此外,定向医学生的培养作为全科医生培养工作中的重要一环,涵盖从医学院校教育到毕业后教育、继续教育的多个阶段,是一项时间跨度大、持续时间长、涉及环节多的系统性工程。项目开展数十年来的教育教学经验,为创新基层卫生人才培养模式,推动全科医学的医教协同发展提供了重要的借鉴与参考。
本研究回顾了2010—2023年针对我国五年制本科定向医学生的医学教育研究,一定数量的研究表明,该领域研究正在发展,但也存在着研究质量普遍不高、跨机构跨地区研究不足、研究内容和评价指标缺乏订单定向特色、对毕业后教育和继续教育关注不足等问题。
3.1 定向医学生的教育研究关注度逐年增加,但研究质量较差,缺乏多机构多地区合作
从文献发表时间、数量来看,定向医学生的教育研究数量随年份逐年上升,提示该领域关注度增加,这与董惠玲等[22]和张年等[20]的研究结果一致,定向医学生人才培养模式是目前该领域的研究热点。从研究单位和地区来看,研究的作者单位分布全国,但主要集中于我国西部地区,这与该项目“为中西部乡镇卫生院及以下的医疗卫生机构培养全科医疗卫生人才”的政策导向一致,同时随着各地在当地财政支持下陆续自行开展该工作[37],北京市、浙江省等东部经济发达地区也逐渐加大对该领域的关注。此外,本研究结果显示,绝大多数研究都在单机构开展,仅一项研究涉及同一地区多机构,无跨地区研究,这与魏艳君等[21]、董惠玲等[22]研究结果相同,机构间合作紧密度不足在一定程度上制约了定向医学生培养及相关研究的发展。
从研究质量评分来看,根据既往研究,MERQSI分数越高表明研究设计和方法质量越高,14分及以上表明研究质量较高[38]。在本研究中,纳入文献的MERSQI总分(10.4±2.4)分,最高分14.0分,提示这些研究质量普遍不高,这与国际经验一致,此类研究的质量普遍偏低[4,39-40]。2篇发表在Cochrane的系统综述[39-40]旨在寻找能有效增加在农村地区工作的卫生专业人员数量的教育措施证据,但只有一项研究被纳入,且证据等级较低,因此这些教育措施的有效性仍待进一步研究。同时,从文献发表的期刊看,本研究纳入文献所在期刊权威度低、缺乏英文期刊,也提示该领域研究质量不高,且缺乏国际交流。此外还值得关注的是,本研究在文献筛检阶段剔除了不符合研究目的的90篇描述性研究,同样提示了该领域研究关注度高但有效循证证据不足。进一步分析本研究的结果,发现MERSQI中的样本机构数、评价工具效度、结局指标,以及NOS-E中的对照组可比性和盲法是导致得分较低的主要因素,这提示需开展设计严谨、评价客观、设有对照组的干预性实证研究[33],以提高教育循证证据的质量[41],便于更好地批判性地评估教育措施对农村地区工作的卫生专业人员数量的影响,而多机构多地区间的合作可有效促进多中心研究的开展,进一步推动研究质量的提升。
因此,建议促进多机构多地区间的研究合作,加强相关研究的培训,提高教育研究的设计和实施能力,并鼓励在国际期刊上发表研究成果以促进国际交流。可利用现有的学术平台资源,比如由113所高校发起成立的“全国农村订单定向医学生培养院校联盟”[42],该联盟通过定期举办学术年会、成员间的深入交流和资源共享,针对全科医学教育的难题、热点和关注点进行探讨,为创新基层卫生人才培养模式,推动全科医学学科的发展和教育改革,以及加强基层医疗卫生人才队伍的建设提供了充足的学术保障。
3.2 研究内容和评价指标缺乏订单定向特色
从研究内容来看,本次研究纳入的文献,大部分探究了课程调整(89%)对定向医学生学业等情况的影响。其中,大部分研究设计是围绕系统解剖学、医学微生物学等医学基础课程的课程内容、结构调整,只有7项(19%)研究是探究开设农村、基层或全科的课程对定向医学生的影响,这与国际上类似项目的教育研究现状不符。澳大利亚[9]、美国[10]、印度[11]等国家的研究表明,增加医学生和住院医师的农村临床环境暴露量(即增设农村卫生和全科医学的课程体系、安排在农村执业的家庭医生或初级卫生保健医师作临床导师、安排医学生在设有农村医院及农村家庭医生的门诊见习和轮转等教育干预措施),对增加和保留在农村地区工作的卫生专业人员数量具有积极作用[24]。与国际经验相比,我国还较为缺乏对此类订单定向特色课程(即专门针对农村、基层或全科的课程)如何影响项目进展的探究,结合2018年李玉华等[43]对定向医学生本科培养方案现状的调查,缺乏相应研究可能是因为目前还普遍缺乏针对农村定向生的全科及农村相关的医学课程。另外,有研究证据表明,职业生涯教育对定向医学生履约率有很好的提升作用[44],均提示未来该领域研究者需关注并开发更多订单定向特色课程。培养模式构建类研究方面,结合李玉华等[43]和申正付等[45]的调查,我国承担定向医学生培养的高校中,存在大量“4+1”“3.5+1.5”“2.5+1+1.5”等不同形式的培养模式,但在本研究中,仅有3项(8%)涉及构建新培养模式相关的实证研究,这提示该领域研究尚缺乏对不同培养模式如何影响定向医学生履约、留任等职业行为的比较研究。
评价指标方面,研究者们应注意的是,定向医学生的培养既有医学教育的共性,又有其独特的个性[44],故需更多地关注相应课程,特别是订单定向特色课程对订单定向特色评价指标(如考试成绩、履约、留任和工作绩效等方面)的影响。但本研究纳入的文献,使用的评价指标基本都在柯氏分级的反应层(70%)、学习层(89%),极少研究关注了教学对学生实际行为改变的行为层(3%)和教学带来的机构改变或患者获益的结果层(3%),同时,也缺乏相应教育干预措施对项目本身及远期影响的关注。尽管国内已有大量研究探究了项目开展对上述指标的影响,但由于项目及政策本身的复杂性,包含了医学教育措施、激励类措施、强制约束类措施等多重影响因素[46],造成了结论的循证等级不高及外推局限。但有多项系统性综述[4,6,24,35]的证据证明,不同于其他措施,医学教育措施在改善不同经济发展阶段、教育和卫生系统差异的多个国家的农村医生短缺方面发挥了积极作用。因此,有必要进一步加强对该项目中教育干预措施实施后效果评价的关注。此外,从国际经验可知,教育措施的长期影响和基层全科医生队伍可持续性的证据可能在未来几年才会显现[47-48],故可充分借鉴国外研究经验[7,25,49],依靠学术团体制定统一衡量标准、跨区域的评估方案,有助于进行科学的比较,从而提高结论的循证等级和外推性,为解决这一全球性公共卫生问题贡献中国的智慧和力量。
因此,建议重点关注订单定向特色课程的开发和研究,在各阶段的培养计划中,应调整并增加全科医学类课程及其学时,以及面向社区等基层医疗卫生服务机构的基层基地实践时间;同时,应加强职业生涯和职业发展教育,确保全科医学理论和技能的培养贯穿于定向医学生培养的全过程。此外,依托跨地区跨机构的学术平台构建统一的评价指标,进一步验证不同培养模式和教育措施的有效性,从而为相关政策和培养方案的制定提供高质量的循证证据。
3.3 研究主要集中在本科院校教育阶段,缺乏对毕业后教育和继续教育阶段的关注
本研究纳入文献几乎全部在本科院校教育阶段开展,仅一项在毕业后教育阶段,未发现关于定向医学生继续教育阶段的教育实证研究,这与国际上类似项目在各教育阶段研究分布平均的现象不符[23,25]。分析我国缺乏定向医学生毕业后教育阶段和继续教育阶段研究可能的原因:定向医学生从各院校毕业后,毕业后教育阶段和继续教育融入既往已有的体系中,开展相应的教育研究时,直接将定向医学生纳入全科医生总体中;并且我国定向医学生培养项目实施时间短,已进入职场的定向医学生的人数有限,研究者们尚未关注到他们继续教育阶段的需求。但需要注意的是,自2018年起约3.5万名定向医学生已按计划服务于农村基层[50],并且,一项针对全国定向医学生期满留任意愿的Meta分析显示留任意愿率仅16%[51],而继续教育的有无和质量是影响留任率的关键因素之一[47,52],故开展针对定向医学生继续教育阶段的教学研究有较强的实践价值和现实意义。进一步地来看,我国全科医学引入国内较晚,尚未形成统一、有效的,针对全科医生的继续医学教育体系[53],定向医学生作为高素质高标准全科医生的代表,以定向医学生为样本人群,探索全科医生毕业后教育和继续教育阶段的教学和培训研究,可为稳定基层卫生人才队伍,创新基层卫生人才培养模式提供重要的借鉴和参考。
因此,建议对定向医学生毕业后教育和继续教育阶段的研究加大力度,并对各培养环节进行连续性一体化教学设计[54]和全面、动态的分析,为基层医疗卫生人才队伍建设提供系统化的研究成果和循证证据,确保该项目的教育过程成为一个持续改进的良性循环,从而保障每个培养阶段的质量和水平。对此,相关部门也已展开相应探索。国家卫生健康委能力建设和继续教育中心于2023年1月发起了“农村定向医生能力提升工程”[55],河北省、河南省、贵州省和广西壮族自治区成为首批试点省份。该工程主要从5个方面开展:依托中国继续医学教育网,建立定向生线上培训专栏和个人电子学习档案,形成持续帮扶机制;创建交流社群,为定向生、行政管理人员和专家组提供交流平台;国家级专家组对定向生进行长期、持续的指导、管理和帮扶;根据基层需求,选派优秀定向医生到核心专家组所在的医疗机构进行短期交流学习;不定期举办全国性的定向生技能竞赛、病例演讲比赛等线下活动,为定向生提供一个展示自我、互动交流的平台。
4 小结
尽管近年来定向医学生的教育研究领域得到重视,但仍面临着诸多问题和挑战,如研究质量普遍不高、跨机构跨地区合作不足、研究内容和评价指标缺乏订单定向特色、对毕业后教育和继续教育关注不足等。未来我国全科教育工作者需要加强多机构合作研究及国际交流,提高研究设计与方法质量,并建立具有订单定向特色的统一评价体系;同时,加强农村及全科相关的订单定向特色课程设计,关注包含毕业后教育和继续教育阶段的连续性一体化教学设计,多方面提升该领域教育研究质量,为相关政策及培养方案的制定提供高质量循证证据。
由于人力、物力有限,本次研究仅分析了我国定向医学本科生医学生的教育培训研究,未进行国际上类似项目的比较研究,也缺乏对灰色文献进行深入检索。尽管如此,本研究在一定程度上仍能揭示近年来该领域的研究动态和现状,并对所纳入文献的质量进行有效评估,从而为该领域未来的深入研究奠定基础。
参考文献略
















































