中美韩健康与营养调查数据库建设与应用研究
国民健康与营养状况是衡量一个国家卫生保健、经济社会发展和人口素质的重要指标。从20世纪60年代开始,世界上先后有多个国家定期开展国民健康与营养专项调查,构建了相应的公共数据库,及时发布国民健康与营养状况报告,并据此制定和修改社会政策和标准,以改善国民健康和营养状况[1-3]。其中,健康与营养调查数据库建设较为系统规范的国家有中国、美国、韩国等。本文介绍了中美韩3个国家健康与营养调查数据库的建设发展情况,并进行对比分析,重点对应用3个数据库发表文献的情况进行可视化分析,为推动医学公共数据资源的广泛应用提供方法和路径。
1 中美韩健康与营养调查项目介绍
1.1 数据库建设
中国健康与营养调查(China Health and Nutrition Survey,CHNS)项目是由美国北卡罗来纳大学教堂山分校人口中心与中国疾病预防控制中心营养所联合开展的队列研究[4]。CHNS是一个不断更新的动态队列[5],旨在了解中国的社会、经济、人口变化及其如何影响整个生命周期的健康状况,为新时期相关政策的制定、修改和完善提供科学依据[6]。CHNS涵盖了中国居民在个人、家庭和社区层面的信息,为开展研究提供了全面的数据支持[7]。CHNS是中国第一个基于个人和家庭的大规模调查数据库[8],来自世界各地的学者均可以免费注册账号并访问,其官方网址: https://www.cpc.unc.edu/projects/china 。
美国国家健康与营养调查(National Health and Nutrition Examination Survey,NHANES)是一项连续的基于人群的横断面调查,其独特之处在于其结合了健康访谈和健康检查[9]。NHANES的主要目的是通过结合健康访谈、健康检查和营养调查,以评估美国成人和儿童的健康和营养状况[10]。NHANES数据库向全世界研究者免费开放,用于解决未来的医疗、环境和公共卫生等问题,并为政府制定公共卫生政策和卫生服务计划提供科学依据[11]。NHANES官方网址: https://www.cdc.gov/nchs/nhanes/index.htm 。
韩国国家健康与营养调查(Korea National Health and Nutrition Examination Survey,KNHANES)是一个公开的、连续的横断面监测系统,旨在对韩国人口的健康状况、健康行为、食物和营养消耗进行全国性统计,进而评估本国居民的健康和营养状况。KNHANES项目通过健康访谈、健康检查和营养调查3部分获取代表性的国民信息,为制定和更改本国卫生政策和计划提供数据基础[12-13]。KNHANES官方网址: https://knhanes.kdca.go.kr/ 。
1.2 历史追溯
各国健康与营养调查项目均具有悠久历史。我国的CHNS项目始于1989年,但并非连续的年度调查,其调查间隔为2~4年,目前已经进行了11次,2019年调查数据仍在整理中,尚未公开发布。自1960年初以来,美国疾病预防控制中心健康与营养调查司进行了一系列健康与营养调查,从1971年到1994年,NHANES项目定期进行,为更好了解国民健康与营养状况,自1999年起,其调整为两年一个周期的连续性调查[14]。KNHANES项目始于1998年,1998、2001、2005年前3阶段的调查并非连续的年度调查,后为了提高统计数据的及时性,从2007年开始,改变为连续性的年度调查,从而产生及时可靠的全国年度统计数据,为国家发布年度调查报告提供科学基础[15]。
1.3 抽样方法
在CHNS项目中,不同地区参与者的地理环境、经济发展水平、人口结构、卫生条件、膳食结构和公共资源等存在一定差异,因此CHNS采用多阶段分层整群随机抽样。在2015年的调查中,主要抽样单位有360个,约7 200个家庭,共计30 000余人[2,16-17]。
NHANES项目和KNHANES项目均采用复杂的多阶段概率抽样的方法来选择代表本国居民的参与者。NHANES项目由4个抽样阶段组成,每年计划抽取5 000人。此外,NHANES项目还对某些人口亚组(如:西班牙裔、非西班牙裔黑人、非黑人亚裔等)进行过度抽样,以提高特定亚组人群健康状况估计的可靠性和准确性[18-19]。KNHANES抽样设计分为3阶段,每年计划抽取10 000人,应答率约为80%。表1比较了CHNS、NHANES和KNHANES项目抽样方法。

1.4 调查内容
各国健康与营养调查内容并非完全一致,但整体调查框架相似,大致分为3部分:健康访谈、健康检查和营养调查[20]。考虑到疾病流行程度和危险因素暴露在不同年龄段有一定差异,因此健康访谈问卷的内容根据不同年龄段有所调整。健康检查是由经过培训的专业医疗工作者进行。膳食调查采用24 h膳食回顾法收集相关饮食信息[13]。CHNS、NHANES和KNHANES调查内容汇总见表2。为弥补NHANES和KNHANES横断面研究的局限性,提高健康与营养数据的利用率,美国和韩国将其与国家统计局死亡原因数据相链接,为研究发病和死亡的危险因素提供数据支撑。CHNS、NHANES及KNHANES的官方网站涵盖了更多研究细节,且动态更新研究内容,相关调查数据集可在其官网便捷获取[21-23]。
此外,美国NHANES项目于2020年3月—2021年6月暂停调查,现已重新启动,在新一轮的调查中增加了新型冠状病毒感染(COVID-19)相关调查内容(如既往感染状况、严重程度、疫苗接种、抗原检测等信息)[24]。目前2021—2022年调查数据仍在整理当中,尚不能公开获取。

2 数据库应用分析
2.1 发文量分析
本文通过Web of Science(WOS)数据库进行主题检索,检索词如下:TS=("National Health and Nutrition Examination Survey" OR "NHANES")、TS=("China Health and Nutrition Survey" OR "CHNS")、TS=("Korea National Health and Nutrition Examination Survey" OR "KNHANES"),得到历年来基于各数据库发文量。图1显示了利用2012—2021年发文量绘制CHNS、NHANES、KNHANES数据库发文趋势。可见,近10年来,基于CHNS、NHANES、KNHANES数据库的发文量均呈现显著的逐年上升趋势。其中,基于CHNS和KNHANES的发文量相近,至2021年达到300余篇,而基于NHANES的发文量更加突出,是CHNS和KNHANES发文量5倍以上,2021年达到1 700篇。

2.2 研究热点分析
为了解利用CHNS、NHANES、KNHANES数据库发表文献的研究热点,本研究借助计量分析软件CiteSpace[25-26],围绕基于CHNS、NHANES、KNHANES数据库发表论文的关键词进行可视化分析。用WOS核心合集数据库检索近5年发表文献,检索策略同上,排除不相关文献,最后整合所有文献[27]。在2018年1月—2022年10月,基于CHNS、NHANES、KNHANES数据库的发表文献,分别为1 133、6 912、1 330篇,利用CiteSpace软件对发表文章的关键词进行可视化分析,得到3个数据库研究热点关键词共现图(图2~4)。从研究热点关键词共现图中可以看出3个数据库重点研究内容相似,“obesity”“risk”“prevalence” “cardiovascular disease”“physical activity”“hypertension”“association”“health”“adult”“depression”“mortality”等关键词节点较大,节点越大提示上述关键词出现频率越高。为了使图形更加美观,本研究选择彩色的圆圈代表各关键词,圆圈大小反映关键词出现频次的高低,连线粗细代表各关键词之间的关联强度。该结果反映了当前健康与营养调查乃至更大范围公共卫生领域的研究热点,可为研究者开展基于数据库的研究提供思路。



CHNS、NHANES和KNHANES 3个数据库的研究热点也有一定差别。NHANES和KNHANES可以链接本国死亡原因数据,因而针对死亡率(mortality)的研究更广泛[28-29]。3个数据库均有关于心理健康的调查,NHANES和KNHANES中有抑郁量表评分,因此在研究热点关键词共现图中,出现抑郁(depression)关键词,且节点较大(图3、4),提示有较多研究者开展此方面的研究[30-31]。CHNS项目包含关于压力和心理状况的调查,但无抑郁量表评分,因此在CHNS研究热点关键词共现图中未观察到抑郁(depression)节点(图2)。
3 讨论
本研究将国内外健康与营养调查数据库进行系统梳理,为研究者单独或联合应用不同国家健康与营养调查公共数据库开展研究提供了方法和路径。既往也有学者对单个健康与营养调查数据库进行介绍,但未针对多个国家健康与营养调查公共数据库进行系统的、全面的对比分析。
基于中美韩3个国家健康与营养调查数据库的二次研究发文量较少,且二次研究多为研究者对数据库基本情况、变化内容的介绍,因此在汇总各数据库近10年的发文量分析中,没有将原始研究和二次研究发文量的趋势分开描述,而是将原始研究和二次研究发文量汇总,进而得到2012—2021年各数据库的发文趋势。
CHNS项目有其自身独特之处,其是一项前瞻性的队列研究,收集了社会学、经济学等方面的信息,且更符合我国的基本情况。最新的CHNS有许多新的突破,包括计算机辅助营养调查系统的升级与完善;研究内容上更加丰富,如增加了中老年人认知功能筛查,但仍需向NHANES、KNHANES学习。首先,NHANES、KNHANES调查均由经过培训的专职调查人员开展,且大部分的调查项目在移动检测中心(Mobile Examination Centers,MEC)进行,可较好控制误差。其次,NHANES、KNHANES项目均为连续性的年度调查,数据发布及时。最后,NHANES、KNHANES项目可以与本国卫生统计中心的死亡数据相链接,弥补其作为横断面研究的局限性。
CHNS和KNHANES项目的年发文量相近,但与NHANES年发文量相比有较大差距。究其原因:(1)NHANES数据库信息发布更及时、更规范。(2)NHANES数据库历史悠久且调查内容在不断丰富,为研究者累积了更全面、时间跨度更长的数据资源。(3)NHANES数据库是在以英语为母语的美国开展的,英语作为世界上应用最广泛的语言,各国研究者更容易掌握NHANES项目内容。但与此同时,CHNS和KNHANES也在不断调整优化各自的调查内容与流程,便于更多研究者应用。
本研究首先对CHNS、NHANES和KNHANES的建设现状、历史追溯、抽样方法、调查内容等进行系统梳理和对比分析,接着对基于中、美、韩健康与营养调查数据库发文情况进行计量分析,有助于更多研究者系统了解和广泛应用上述3个公共数据库,最后利用CiteSpace软件对基于3个数据库的热点研究内容进行可视化分析,便于研究者了解该类数据库的热点内容,期望为研究者开展相关研究提供路径,更好地促进科学证据产出。
本研究仍存在局限性,仅汇总了中、美、韩3个国家的健康与营养调查公共数据库,仍有其他国家因未公开或未开展该类调查,故没有被纳入本研究。此外,在数据库应用分析中,发文量是利用Web of Science核心合集检索得到的文献,并非利用相应数据库发表的全部文献,但可代表基于健康与营养调查数据库发文趋势,对比较不同国家数据库发文量的差异具有重要的参考意义。
针对公开数据库未来的创建和利用提出以下建议:(1)开展针对研究者的培训教育。当前利用中、美、韩3个国家健康与营养调查数据库取得了许多具有国际影响力的重要成果,但对3个数据库的应用仍是不充分的,未来可以开展针对研究者的培训教育,扩大研究者对健康与营养调查的了解,进而激发更多研究者挖掘公共数据库中的数据,开展基于数据库的科学研究。(2)创建全球健康与营养公共平台。当前南加州大学已经建立全球健康与老龄化网站( https://g2aging.org/ )。该网站汇聚了世界上多个国家健康与老龄化相关数据,为全球开展老龄化研究提供了便捷。未来希望更多国家开放其健康与营养调查数据,建立全球健康与营养调查公共平台,进而便于研究者多维度应用各国健康与营养调查数据,为科学研究、循证支持提供更加强有力的证据。(3)调整调查内容,优化调查过程。调查内容应随着疾病患病率和对人群健康危害程度进行调整,且不同国家数据库间要相互学习,取长补短。调查过程更加科学,调查技术更加先进,进而得到更加真实、可靠的数据。
本文无利益冲突。
参考文献略
最后编辑于 2023-10-26 · 浏览 2305