系统评价与Meta分析作为药物流行病学研究的重要设计类型,可为药物安全性、有效性评价等提供核心证据支持。《药物流行病学研究方法学指南(第2版)》(以下简称“指南第2版”)将系统评价、Meta分析归为二次研究类型,并概述Meta分析、网状Meta分析在药物疗效比较中的使用场景,以及人工智能在系统评价文献筛选环节中的应用。本文在指南第2版的基础上,围绕评价范畴拓展、合成方法学创新、智能范式革新三个维度,进一步阐述系统评价与Meta分析的应用进展,并以网状Meta分析为例,描述其在药物流行病学研究中的具体实施流程,旨在为研究者开展药物流行病学领域的系统评价与Meta分析提供方法学参考。
系统评价最早源于研究合成,旨在减少结果解释中的偏倚[1]。20世纪80年代,英国医生和公共卫生学者Archie Cochrane正式提出系统评价的概念[1-2]。随着国际Cochrane协作网的成立,系统评价的方法学体系日渐完善。Cochrane协作网定义系统评价为:收集符合预先设定标准的证据,回答特定的研究问题,通过采用明确、系统的方法,力求将偏倚降至最低[3]。Meta分析作为一种统计分析方法,于1976年被英国心理学家Glass提出,其本质是通过对多项研究的结果进行整合,估算出综合效应量[4-6]。Meta分析可通过增加样本量,减少偏倚,提高检验效能,尤其当多项研究结果不一致时,可克服因研究质量、样本量不足等造成的偏倚,得到更接近真实情况的综合分析结果[7-8]。系统评价与Meta分析常被混淆,系统评价可包括也可不包括Meta分析,Meta分析既可作为系统评价的一部分,也可被单独应用。
2025年中国药学会发布团体标准《药物流行病学研究方法学指南(第2版)》(以下简称“指南第2版”),立足国情、借鉴国际前沿方法,引入新兴研究技术,旨在为我国药物流行病学研究提供科学、规范、前瞻的参考依据[9]。指南第2版将系统评价、Meta分析归为二次研究类型,并指出开展药物疗效比较研究时,若主要目的是估计两种干预措施的相对效果,可使用两两比较的Meta分析,若评估两个或多个干预措施的相对效果,可采用网状Meta分析(network Meta-analysis,NMA)。随着系统评价与Meta分析方法学的不断优化,以及运用场景的不断拓展,除指南第2版提及的上述研究方法外,已形成剂量-反应Meta分析(dose-response Meta-analysis,DRMA)等多种新的分析方法。本文将围绕评价范畴拓展、合成方法学创新、智能范式革新三个维度(图1),对指南第2版中的相关内容进行拓展,通过概述各方法的适用场景和方法学要点,为基于系统评价与Meta分析开展药物流行病学研究提供方法学参考,研究者可基于研究目的和证据类型选择适宜的分析方法。
1 应用进展
1.1 评价范畴拓展:从随机对照试验到多元证据体整合
20世纪70年代,Cochrane指出随机对照试验(randomized controlled trial,RCT)是检验卫生干预措施的最佳方法,并进一步指出应将医学领域里所有相关的RCT收集起来综合分析并不断更新,以得出更可靠的结论[1, 10-11]。随后,1983年Furberg[12]发表了卫生保健领域的第一篇系统评价,通过系统查找已发表的所有相关临床试验,评价抗心律失常药物是否可以降低心肌梗死后的死亡率。此后,在较长的时间里,系统评价与Meta分析都主要用于RCT的证据整合,评价干预措施的临床疗效,正如指南第2版所述“当主要目的是估计两种干预措施的相对效果时,可使用RCT结果进行两两比较的Meta分析”。随着决策需求的增加和方法学拓展,系统评价与Meta分析的应用范畴已从单纯的干预疗效评估,逐步拓展至病因/危险因素探索、诊断准确性、预后评估等多元化的决策问题,例如分析药品不良反应的危险因素、药物的诊断准确性以及药物干预后的远期不良结局等。这一演进促使系统评价与Meta分析的方法学体系不断完善,现已形成针对不同证据类型的整合方法。本文将基于证据的数据类型,阐述该方法在定量、定性和混合方法研究中的应用,其中针对定量研究,将重点描述该方法在病因/危险因素、诊断及预后相关证据中的应用。
1.1.1 定量研究的系统评价与Meta分析
(1)病因/危险因素研究的系统评价与Meta分析:病因/危险因素研究旨在探讨特定因素与结局事件的关联性,例如评价新型口服抗凝药利伐沙班是否为胃肠道出血的危险因素,可采用的研究设计除RCT外,还包括非RCT以及队列研究、病例对照研究等观察性研究[13]。基于上述研究设计类型的系统评价与Meta分析方法学要点:①数据提取阶段,需明确结局数据类型,提取各组对应的核心统计量,例如二分类数据(是否发生胃肠道出血等)应提取事件数与总例数、连续型数据(利伐沙班平均用药剂量等)应提取均数与标准差[14];②应根据纳入的研究类型选择差异化的偏倚风险评估工具,例如RCT可选择偏倚风险评估工具2.0版(risk of bias 2.0,RoB 2.0)、非RCT可选择非随机研究偏倚风险评估工具(risk of bias in non-randomized studies-of interventions,ROBINS-I)、观察性研究可选择纽卡斯尔-渥太华量表(Newcastle-Ottawa Scale,NOS)[15];③应根据数据类型选择适宜的效应量指标,例如二分类数据可用风险比(risk ratio,RR)、比值比(odds ratio,OR)或风险差(risk difference,RD),连续型数据可用均数差(mean difference,MD)或标准化均数差(standardized mean difference,SMD)[16];④排除临床异质性、方法学异质性后,可根据统计学异质性情况选择固定效应模型或随机效应模型进行合并,并通过核查数据、探索异质性(亚组分析或Meta回归)、改变效应指标、排除研究、放弃Meta分析等方式处理异质性[17]。
(2)诊断试验准确性研究的系统评价与Meta分析:诊断试验是指对人体体液、细胞、组织或个体本身实施的任何流程,用于检测、诊断或监测某种疾病状态或疾病进程,其准确性则是评价试验正确将研究对象分类为“存在目标疾病”或“不存在目标疾病”的能力,一般需与基于金标准的分类结果进行对比[18],例如以病原学检查为金标准,评估结核菌素纯蛋白衍生物判断受试者是否感染结核分枝杆菌的准确性。诊断试验准确性研究的系统评价与Meta分析步骤详见Cochrane操作手册[19-20],相较于RCT的系统评价与Meta分析,主要差异如下:①数据提取需基于四格表,提取真阳性例数、假阳性例数、真阴性例数、假阴性例数,并备注阳性阈值;② 单项诊断试验准确性研究或诊断试验准确性比较研究分别采用诊断试验准确性研究的偏倚评估工具QUADAS(Quality Assessment of Diagnostic Accuracy Studies)-2和QUADAS-C评估偏倚风险;③研究异质性普遍较高,推荐使用随机效应模型,并通过Meta回归、亚组分析等,探索异质性来源;④推荐采用分层随机效应模型同时合并灵敏度与特异度,以处理两者的负相关关系,常用的模型包括双变量模型、层次综合受试者工作特征(hierarchical summary receiver operating characteristic,HSROC)模型,当研究间异质性主要来源于阈值,即存在多个阈值情况时,HSROC模型更适用;当异质性主要来源于其他因素时(例如疾病严重程度、参考标准不同),则双变量模型更适用;⑤当纳入分析的研究使用不同阳性阈值,需采用综合受试者工作特征(summary receiver operating characteristic,SROC)描述灵敏度和特异度随阳性阈值变化的关系;当纳入分析的研究使用相同阳性阈值,除采用SROC外,可估计在该特定阈值下的汇总效应指标,如灵敏度合并、特异度合并等;⑥除通过表格、SROC曲线呈现结果外,还可通过配对森林图和链接ROC图展示,配对森林图同时展示各研究的灵敏度和特异度及其置信区间(confidence interval,CI);链接ROC图用于比较两种试验的准确性,通过将同一研究中两种试验的估计值用线连接起来,从而直观地显示各研究内两种试验的差异。
(3)预后研究的系统评价与Meta分析:预后研究旨在描述特定疾病人群未来发生某种临床结局的概率,例如评价长期服用替格瑞洛是否能够降低患者未来发生心血管事件的概率,其核心研究设计为队列研究,一般需同时记录结局事件的发生率和发生时间,即生存数据[21]。若在研究结束时知晓所有患者的临床结局,可参考病因/危险因素研究的系统评价与Meta分析方法学要点,计算RR、OR或RD;若存在删失数据(即在研究结束时,部分患者尚未发生临床结局或因失访等原因无法获知其最终结局状态),需依托Cox比例风险模型计算HR开展系统评价与Meta分析,其方法学特殊性包括 [16-17]:①需满足比例风险假设,即HR在研究期间保持恒定,例如替格瑞洛相较于对照药物降低心血管事件风险的相对效应在研究期间保持稳定;②若能从原始研究者处获取个体患者数据,需对数据进行重新分析以获得HR及其95%CI或标准误(standard error,SE),随后再进行Meta分析;③若仅能获得各研究的汇总统计量,应提取HR、95%CI或SE;④若无法直接提取HR,可通过log-rank检验的O-E统计量与方差推算,或从Kaplan-Meier曲线重构个体数据间接获取。
1.1.2 定性研究证据整合
定性研究证据整合(qualitative evidence synthesis,QES)的基本原理是将多项解释性定性研究的结果汇集在一起,通过反复翻译和整合,产生超越单项研究发现的、更抽象的概念或理论框架,从而获得对现象更深刻的理解[22],例如通过定性研究,探索影响基层医疗机构医生抗菌药物处方行为的关键因素。经整合后的定性证据可为决策者提供额外的决策支持,具体表现为:① 加深对某一现象的理解;②明确干预对象所处环境与干预措施之间的关联;③加深对研究对象的价值观、态度以及相关经历的理解;④理解干预措施和实施过程的复杂性、对不同人群亚组的影响和效果,以及个体特征和不同环境特征所产生的作用[23]。QES的步骤详见Cochrane操作手册[23],在问题制定、证据检索、质量评价、数据提取、结果整合、报告撰写等方面,与定量证据整合均存在显著差异。例如,由于定性研究结果一般以叙述的形式呈现,或经总结后以表格、信息图表或逻辑模型的形式展示,而非统计图表,因此在结果整合时需要对原始研究进行编码,以形成新的理论解释。常见的整合方法包括主题综合法、框架综合法、Meta民族志法等,推荐基于RETREAT框架,根据研究主题、认识论、时间(强度)/时间尺度(持续时间)、资源、专业知识、受众和目的、数据类型,选择适宜的分析方法[24]。
1.1.3 混合方法研究的系统评价
随着社会科学和健康科学领域的干预措施日趋复杂,其效果高度依赖于实施情境、作用机制和主体经验等因素,传统单一范式的系统评价(无论是呈现客观效应量的定量综述,还是探讨主观体验的定性综述)难以全面捕捉和解释干预现象的复杂性。为应对上述挑战,混合方法研究的系统评价(mixed methods systematic review,MMSR)作为一种新的综述方法被提出 [25]。MMSR可将有效性(定量证据)和患者体验(定性证据)结合起来,通过整合分析定量研究、定性研究和混合方法研究,帮助研究者更好地理解干预是否有效以及如何有效,并指导后续临床决策,例如为探究基于移动应用程序的自我管理干预能否改善2型糖尿病患者用药依从性与健康结局,一方面可通过RCT,定量评价该程序是否可改善患者停药率、降低糖化血红蛋白水平;另一方面,可通过定性研究,分析患者在实际使用中面临的障碍及促进因素。依据澳大利亚乔安娜布里格斯研究所(Joanna Briggs Institute,JBI)循证卫生保健中心牵头制定的MMSR指南[26],其数据整合方法分为会聚方法和顺序方法[26-27],以会聚方法为主。会聚方法包括会聚整合和会聚分离:在会聚整合中,数据提取阶段即需将数据进行转化,最常用的是通过主题分析产生主题、批判解释性整合产生框架、现实主义整合产生理论、关联规则挖掘方法等方式,将定量证据进行文本叙述性解释,再与定性证据相结合;会聚分离则需对定量和定性证据进行独立综合后再进一步整合[26-27]。
1.2 合成方法创新:从两两比较到复杂决策支持
随着系统评价与Meta分析的应用范围不断扩展,其统计方法与证据合成技术也在持续演进。传统上依赖两两比较的分析框架在应对复杂临床决策时,逐渐暴露出局限,例如难以同时评估多种干预措施的相对优劣、无法有效整合剂量-反应关系等关键信息。为突破上述限制,一系列创新合成方法应运而生。
(1)NMA:传统的系统评价与Meta分析主要针对特定疾病、特定人群或具体场景下两种干预措施的相对优劣比较。但一种疾病通常会有两种以上的干预方案,此时可按照指南第2版所述,通过NMA评估两个或多个干预措施的相对效果,其基本原理是通过合并直接比较和间接比较的研究结果,在同一个统计学模型中同时评估3种及以上干预措施的相对效果,并对其进行排序[28],例如评估21种抗抑郁药物在成人重度抑郁障碍急性治疗中的效果,并确定最优药物[29]。任何通过直接比较将3种及以上干预措施关联起来的研究组合,都可以形成一个干预措施网络(即网状图),在该网络中,干预措施间可以通过多种方式进行间接比较,对于从未在单项研究中进行过直接比较的干预措施,可以利用现有的直接干预效应估计值,通过数学组合进行估算[28]。研究[28, 30]表明,与单一的直接或间接估计相比,NMA能得出更精确的干预效应估计值。
开展NMA的前提是必须满足同质性假设、相似性假设和一致性假设三大假设[28, 31]:①同质性假设,即直接比较研究间不存在异质性,分析方法与传统系统评价与Meta分析一致;②相似性假设,即所有间接比较研究间影响结果的因素相似,只能通过间接方法分析,以比较研究间的临床和方法学相似性(例如患者特征、试验设计类型等)最常用;③一致性假设,即直接比较和间接比较证据或不同路径的间接比较证据结果应保持一致,常见的检验方法包括假设检验、后推法、点分法等。当上述假设因研究对象特征、药物干预方案、结局指标定义等不同而被违背时,应采取针对性的处理策略:对于同质性假设,可参考传统Meta分析的异质性处理方法(如亚组分析、Meta回归等);对于相似性和一致性假设,可采用网状Meta回归探索效应修饰因子[32]、使用点分法识别不一致性来源,或分别报告直接与间接证据,甚至考虑放弃合并结果,进行描述性分析。此外,应明确说明是基于频率法还是贝叶斯法。频率法基于假设检验与可信区间理论,采用倒方差法整合直接比较与间接比较的证据,原理简明、计算高效,但在研究间异质性较高时,估计效果易受影响;相比之下,贝叶斯方法通过构建马尔可夫链模拟参数的后验分布进行统计推断,在数据稀缺或不确定性较强的情况下,能提供更稳健的估计结果[33]。
(2)DRMA:传统的Meta分析仅能提示干预措施对结局是否有效,当存在多个剂量水平且需要探究效应变化趋势时,应采用DRMA,例如探究糖皮质激素治疗社区获得性细菌性肺炎的最佳剂量[34]。DRMA的本质是一种Meta回归模型,基于所纳入原始研究的多个剂量组数据,通过特定的统计模型拟合线性或非线性剂量-反应曲线,从而探讨干预措施的效果如何随着剂量、治疗频次或治疗持续时间的变化而变化[35],其核心是估算回归系数和合并回归系数。回归系数的估算方法有多种,例如最小二乘法、广义最小二乘法和最大似然估计等,合并回归系数主要包括将所有原始研究看成一个整体的一阶段法和考虑各原始研究间异质性的二阶段法[36-38]。一阶段法使用所有数据点进行拟合,通常能提供更精确的估计,但当研究数量较多时,计算程序变得异常繁琐;二阶段法首先拟合单篇研究的回归系数,再采用固定或随机效应模型合并[39-40],易于理解和实施,但可能因信息损失而引入偏倚。
开展DRMA时,应注意如下事项[41]:①暴露与结局间存在关联是开展DRMA的前提,因此,首先应提取文献中最高剂量组与最低剂量组的RR或OR及其95%CI等数据,基于二分类Meta分析,仅当合并的效应值有统计学意义时,再进一步探讨是否存在剂量-反应关系;②仅限于纳入研究设计相同的研究(如仅纳入RCT或仅纳入队列研究);③原始研究应至少具有3个及以上组别,且需统一各项原始研究的参照剂量,通常以每项研究最低剂量组为参照。若参照暴露水平不同或不为0,需对参照剂量进行中心化,例如对于线性模型,可将每个原始剂量减去同研究参照剂量;④建议首先拟合非线性模型,再根据非线性检验、似然比检验等方法,确定是线性还是非线性关系;⑤由于针对向下开区间、向上开区间和闭合区间的剂量值确定方法尚未达成一致,建议采用多种方法进行敏感性分析。
(3)个体数据Meta分析(individual participant data Meta-analysis,IPD-MA):当现有已发表数据或其他汇总数据无法获得高质量证据,或不足以进行深入分析时,应考虑采用IPD-MA[42]。该研究类型需收集、核查和重新分析每项研究中每位参与者的原始数据,数据可从研究调查人员处获取,或通过数据共享库及平台获取[42],例如通过联系RCT的研究者获得个体患者数据,从而探讨血管加压素治疗对成人感染性休克患者的总体疗效与安全性,同时分析其在早期或晚期休克等预设亚组中的作用差异[43]。相较于基于汇总数据的Meta分析,IPD-MA可弥补单项研究报告不足的缺陷,提升数据数量和质量,并支持根据研究目的,开展更详细、更灵活的数据分析,有助于提供更可靠的研究结果[42, 44-45],但其通常耗时更长、成本更高,且需研究者具备数据获取、管理和分析等多方面技能。因此,需权衡收集个体数据相较于传统方法,在研究目标、数据数量、质量、所需分析方面的价值,并考虑是否可获得足够的个体数据以进行可靠分析。
相较于传统的系统评价与Meta分析,IPD-MA的实质性差异表现在数据收集、核查和分析环节,详见Cochrane操作手册[42]:①数据来源更广,常需与跨国、跨学科的研究团队建立协作,签订数据共享协议,明确数据安全与保密条款;②数据核查更严格且全面,涉及数据重新编码和定义、数据完整性核查、随机化和分配序列隐藏核查、失访核查、结局指标核查等;③可实现更灵活、更深入的统计分析。在研究方案中,应预先阐述拟采用的分析方法,一般采用两阶段分析方法,即在第一阶段独立分析每项研究,将个体数据简化为汇总数据;第二阶段采用与传统系统评价相同的方式合并汇总数据,以获得合并效应估计值[46]。
(4)序贯Meta分析(sequential Meta-analysis,SMA):随着Meta分析中证据的不断积累,确定结果何时可被视为定论,对于指导系统评价更新及未来试验设计而言至关重要 [47]。SMA基本原理是将临床试验中的序贯检验方法与Meta分析相结合,每纳入一项新研究后重新评估累积证据的强度,从而判断现有证据是否已足够充分和稳定,从而避免不必要的后续研究 [48],例如采用SMA探讨补充维生素D对跌倒的影响,每新增一项试验即开展累积分析,结果显示,维生素D无法将跌倒风险降低15%或以上,且结果保持稳定,从而指出未来开展相似的试验也难以改变该结果,可避免研究浪费[49]。相较于基于累积数据反复开展假设检验,SMA通过对重复检验实施校正,从整体层面控制显著性水平α,进而降低I型错误的发生风险[50]。常见的SMA方法包括试验序贯分析(trial sequential analysis,TSA)、Whitehead双三角检验SMA、半贝叶斯法[48, 51-52],以TSA应用最为广泛。
(5)前瞻性Meta分析(prospective Meta-analysis,PMA):当前已发表的绝大多数Meta分析可归为回顾性Meta分析,其本质属于探索性研究而非确认性研究。此类研究中,关于纳入标准制定、统计分析方案选择及调节因素筛选等关键决策,多在研究者知晓原始研究结果后确定,这类事后决策易因选择性报告结果的偏倚和发表偏倚等因素产生误导性结论[53]。PMA的关键特点是,需在任何与PMA研究问题相关的单项研究结果确定之前,预先设定研究选择标准、假设及分析方案,从而减少研究浪费和偏见,为研究结论提供具备确认性价值的证据支持[54],例如为评价他汀类药物的疗效与安全性,研究者在1994年即14项RCT结果公布前已制定并发表Meta分析方案,后续严格按预设方案整合参与者数据,结果显示他汀类药物可使主要血管事件风险降低21%,且未增加癌症等不良风险,有效规避了事后调整方案导致的偏倚,为高风险人群开展他汀类药物治疗的临床决策提供了高质量证据[55]。
Cochrane工作组为科学、规范开展PMA提供了方法学指导,核心内容如下[54]:①对于优先级较高且预计将有新研究开展、同时既往证据较为有限的研究问题,可考虑采用PMA;②在与PMA相关的任何具体研究结果发布前,应确定研究问题、纳入标准、研究假设、结局指标及统计分析策略等关键要素;③应系统检索相关文献,通过临床试验注册库识别计划中和正在进行的研究;④理想情况下,PMA由合作或联盟组织进行,包括中央指导委员会(领导PMA并管理协作)、数据分析委员会(负责数据管理、处理和分析)以及各研究代表(参与方案、分析和结果解释的决策);⑤回顾性Meta分析常因不同研究的人群特征、干预措施和数据收集、测量与报告方式不同,导致证据整合受限,而PMA中,各研究在规划或进行阶段即被纳入,研究者可统一相关标准,生成直接关联研究问题的证据,提升结果的信服力;⑥基于RCT的PMA,鉴于前瞻性设计特征,可近似多中心试验的研究价值,推导因果结论,而非仅呈现回顾性Meta分析提示的关联性;对于观察性PMA,由于仅纳入观察性研究,其结果通常应被界定为提供关联性证据,而非揭示因果效应。
(6)动态系统评价(living systematic reviews,LSR):系统评价的实效性至关重要,研究[56]显示,23%的研究可能在2年内过时,7%的研究甚至在发表时就已经过时。因此,包括Cochrane协作组在内的众多学术组织和专家学者均建议定期更新已发表的系统评价,并形成了针对更新标准和流程的专家共识[57-59]。LSR是一种持续更新的系统评价,通过频繁检索,实现对证据的持续监测,及时纳入符合标准的新证据,以保障研究结果的时效性,其本质是一种系统评价更新方法[60], 例如新冠疫情期间,通过定期检索数据库与临床试验注册平台,动态纳入新研究证据,评价新冠病毒药物治疗效果,从而为药物相关决策提供及时的证据支持[61]。
然而,并不是所有系统评价都需要采用LSR,应基于系统评价更新标准[59],建议综合考虑如下因素,决定是否采用:①系统评价是决策的优先事项;②现有证据质量较低或极低;③研究领域发展迅速且新证据不断涌现[60]。证据检索频率以及纳入新证据所需花费的时间,对LSR至关重要。综合考虑研究的可行性以及证据的时效性,推荐应在证据可及时不超过6个月纳入 [60]。为提高LSR的研究效率,在文献检索、筛选、数据提取、偏倚风险评估、结果呈现等流程中,正初步探索人工结合机器自动化的研究模式[62-65]。例如,英国国家卫生与临床优化研究所(National Institute for Health and Care Excellence,NICE)研发的HDAS系统,可定期运行多个数据库的自动化检索,并通过推送功能,提醒研究者新出现的潜在新证据[62]。
(7)范围综述(scoping review,ScR):也被称为映射综述(mapping reviews)或范围研究(scoping studies)[66],通过梳理某特定领域的核心概念、研究空白及证据概况,为实践、政策与研究提供依据[67-69],例如通过开展大麻二酚在牙科领域应用的ScR,指出其在基础研究和临床转化应用等领域均存在较大发展空间[70]。与系统评价与Meta分析致力于解决某相对明确的问题不同(例如某干预措施的疗效),ScR一般适用于如下场景[66, 71]:①作为系统评价的前期准备工作;②识别特定领域的现有证据类型;③发现并分析知识空白;④澄清文献中的核心概念与定义;⑤探讨特定主题的研究实施方式;⑥识别与概念相关的关键特征或影响因素。
ScR的研究流程可参考JBI证据整合手册[66],主要特点如下[66, 68]:①纳入标准较宽泛,可包括任何类型的现有信息,例如原始研究、系统评价、Meta分析、信件、指南、网站等;②建议采用三步证据检索策略,即首先围绕主题在至少两个相关的在线数据库中进行初步检索,随后,应在所有纳入的数据库中,基于所确定的关键词与索引词进行第二轮检索,最后需对已纳入研究的参考文献列表进行追溯检索;③通常不评价所纳入研究的偏倚风险;④通常不对纳入研究的结果进行综合,而是提取结果并以描述方式呈现。
(8)快速综述(rapid review,RR):传统的系统评价通常研究周期较长,难以支撑需快速响应的紧急决策。RR通过简化或省略部分系统评价的研究步骤,例如缩小研究问题范围、凝练评估主题、减少评估内容、限制文献检索日期或数据库、简化数据提取内容等方式[72-73],以有效利用时间和资源的方式为决策者提供证据支持[74-75],例如新冠疫情期间,研究者基于最新研究证据的RR,对瑞德西韦的抗冠状病毒潜力进行了批判性评估,指出尽管该药物被视为候选治疗药物,但在人体中的确切疗效与安全性,仍需通过设计良好的临床试验以提供高质量证据。
2020年,Cochrane工作组发布了关于有效性RR的临时指南,旨在快速审查健康干预措施,以解决紧急和高优先级问题[76],并于2024年发布更新后的RR方法学指南,涵盖建议24条[75],主要内容如下[75, 77]:①建议按重要性排序,纳入 ≤7个对决策至关重要的结局指标;②建议权衡工作量与证据完整性,决定是否限制检索日期、研究环境、发表语言等,并提供临床或方法学依据;③建议根据证据等级,优先纳入与研究问题相关的高质量研究;④建议优先确定核心证据来源与类型,检索时至少选择2个与主题及研究类型相匹配的电子数据库;⑤通常无需检索灰色文献和进行补充检索,若确需进行,可将补充检索范围限定于临床试验注册库及已纳入研究的参考文献;⑥建议2名研究者至少同时筛选20%的文献,若一致性较高,可进行单人筛选;⑦建议由1名研究者提取数据,另1名研究者负责核实关键数据(如结果定义、结果数据等)。
上述各系统评价与Meta分析方法的选择路径见图2。
1.3 智能范式革新:从人工操作到人机协同的智能化赋能
系统评价虽为证据合成的金标准,但其制定过程因耗时费力,面临显著的效率挑战。传统模式下,文献检索、筛选、数据提取及偏倚风险评估等核心环节高度依赖人工操作,这不仅形成资源瓶颈,还可能引入主观误差。近年来,人工智能技术(尤其在自然语言处理、机器学习方面)正推动该类研究从人工操作任务,向智能化、人机协同的新模式演进。正如指南第2版所述人工智能可应用于系统评价的文献筛选,研究[78]显示,基于人工智能技术的自动化工具已在文献检索(15.4%)、初筛(72.4%)、复筛(4.9%)、数据提取(10.6%)、偏倚风险评估(7.3%)、证据整合(1.6%)、证据质量评估(1.6%)和报告(1.6%)等多个环节得到应用,其中文献初筛是当前最主要的应用场景[78-80],代表性工具见表1。
然而,上述工具在实际应用中仍面临挑战[90]:①工具适用性存在局限,多数工具仅在特定研究主题或文献类型(如RCT)中验证,缺乏跨领域适用性,以RobotReviewer为例,其对低偏倚风险研究的识别灵敏度仅16.4%,且仅支持英文文献;②技术操作门槛较高,部分工具要求用户具备计算机基础,对非专业研究者构成使用障碍;③功能整合不足,现有工具多针对单一环节开发(如摘要筛选),缺乏全流程协同能力,导致研究者需在多个平台间手动迁移数据,影响工作效率;④资源可及性受限,部分工具需付费订阅(如Covidence),开源工具则面临维护停滞风险。因此,系统评价尚未实现全流程自动化,仍需在通用性、易用性和平台整合度等方面持续优化。此外,由于人工智能决策过程的“黑箱”特性,其输出结果的可信度与可解释性往往难以得到充分保证,故研究者必须清醒地认识到,当前人工智能工具仅是一种辅助手段,人类监督与审慎判断仍不可或缺。为在确保研究方法学严谨性的同时提升效率与证据质量,构建合理分工、有效协同的人机合作机制至关重要。
2 案例解析
药物疗效比较研究是药物流行病学的重要应用场景,根据数据来源,指南第2版将产生药物疗效比较研究相关证据的方法分为RCT、观察性研究、已发表的RCT证据的整合以及基于RCT和非RCT证据的整合共4类。其中在已发表的RCT证据的整合中,特别提及可采用NMA评估两个或多个干预措施的相对效果。因此,本文以2024年Karlsson等[91]发表于BMJ的NMA研究为例,具体阐述该方法在药物流行病学研究领域的研究流程。该研究旨在比较所有已上市口服药物单药治疗成人偏头痛急性发作的疗效。
2.1 研究背景
药物干预是缓解偏头痛急性发作的重要手段,以实现快速、持续的疼痛缓解为目标。目前,临床拥有多种作用机制的药物,包括非甾体抗炎药、曲普坦类以及新型的吉泮类和地坦类药物。因此,如何为患者选择最合适的治疗方案,已成为关键的临床决策难题。
2.2 研究方法
(1)证据检索:系统检索已发表和未发表的临床研究,包括CENTRAL、Medline、Embase、ClinicalTrials、欧盟和国际临床试验注册平台,以及药品监管机构、制药公司网站。
(2)纳入与排除标准:纳入评估口服药物单药治疗成人(≥18岁)急性偏头痛发作的双盲RCT,对照组为安慰剂或其他疗法。研究对象为根据国际头痛疾病分类被确诊的偏头痛门诊患者,所纳入的药物及其剂量范围需至少被一个国际主要监管机构推荐。此外,鉴于阿片类药物疗效有限、不良反应显著且存在依赖风险,临床指南通常不推荐其用于偏头痛治疗,因此本研究予以排除。
(3)数据提取:由两名研究者独立提取数据,并使用标准化表格进行交叉核对。提取的信息包括研究特征(第一作者、发表年份、研究设计等)、受试者特征(样本量、人口统计学资料、偏头痛类型等)、干预方案(药物名称、剂量、给药途径等)以及主要结局(服药后2 h疼痛消除、服药后2~24 h持续无痛)、次要结局(疼痛缓解、疼痛复发、使用救援药物等)和安全性(腹痛、过敏、便秘等不良事件)结局结果。如遇分歧,通过讨论或咨询第三位研究者解决。
(4)偏倚风险评价:采用RoB 2.0评价每项纳入研究的偏倚风险。
(5)数据分析:
①构建网络结构。首先,为每个结局指标绘制网络关系图。图中节点代表每种干预措施(药物或安慰剂),其大小与接受该干预的患者数量成比例;连线代表存在直接比较的试验,其粗细与直接比较的研究数量成比例。
②假设评估。对网络中每一对直接比较,计算χ2和I2统计量以评估研究间异质性。通过比较纳入研究的临床和方法学特征,定性评估进行间接比较的研究间是否具有相似性。使用全局和局部两种方法评估直接证据和间接证据之间的一致性,其中全局不一致性使用设计-处理交互作用检验,局部不一致性使用反算法、分离直接与间接证据法。
③统计分析。首先采用RevMan软件进行传统的两两Meta分析,计算OR及其95%CI;随后在频率学框架内使用随机效应模型整合直接比较和间接比较证据,评估所有干预措施间的相对疗效和安全性。
④结果呈现:以网络图、森林图、联赛表呈现研究结果,并使用P-score对干预措施进行排序,以量化其相对优劣。
(6)证据质量评价:采用国际推荐的CINeMA(Confidence in Network Meta-Analysis)框架,基于建议评估、制定和评价分级(Grading of Recommendations Assessment,Development and Evaluation,GRADE)原则,对NMA中每一组治疗比较的证据质量进行系统评价和分级(高、中、低、极低)。
(7)亚组分析和敏感性分析:按照性别以及是否发生先兆症状进行分组,开展亚组分析。敏感性分析策略如下:①拆分包含高、低剂量的节点;②仅纳入低偏倚风险的研究;③仅纳入月经性偏头痛的研究;④排除伴有内科/精神共病的研究;⑤排除受试者使用预防性药物的研究。
2.3 研究结果
共纳入RCT 137项,涉及受试者89 445例,接受17种药物治疗。所有药物在2 h疼痛消除方面均优于安慰剂[OR那拉曲坦=1.73,95%CI(1.27,2.34);OR依来曲普坦=5.19,95%CI(4.25,6.33)],除对乙酰氨基酚和那拉曲坦外,其他药物在服药后2~24 h持续无痛方面也表现出显著优势。在不同药物的相互比较中,依来曲普坦在服药后2 h疼痛消除方面表现最优(OR范围1.46~3.01),其次为利扎曲普坦(OR范围1.59~2.44)、舒马曲普坦(OR范围1.35~2.04)和佐米曲普坦(OR范围1.47~1.96)。在24 h持续疼痛消除方面,最有效的干预措施为依来曲普坦(OR范围1.41~2.73)和布洛芬(OR范围3.16~4.82)。在次要疗效结局方面,所有药物在服药后2 h疼痛缓解及2~24 h使用救援药物方面均优于安慰剂。证据可信度从高至极低不等,敏感性分析结果均与主要研究结果一致。
2.4 研究结论
依来曲普坦、利扎曲普坦、舒马曲普坦和佐米曲普坦的表现最佳,且比近期上市的拉米地坦、瑞米吉泮和乌布吉泮更有效。尽管需要进行成本-效益分析,并对心血管高风险患者慎用,但疗效最显著的曲普坦类药物仍应被视为偏头痛急性期的首选治疗方案。
2.5 研究启示
该研究通过药品监管机构、国际试验注册平台,以及联系研究作者和制药公司,将大量未发表的数据纳入分析,但并不能排除部分研究遗漏或同一研究在分析中被重复计入的可能性。此外,大多数结局存在中度异质性,且依据CINeMA评估框架,多数比较结果的证据质量偏低甚至极低。尽管为提升方法学严谨性,开展了亚组分析和敏感性分析,但证据质量仍受原始研究报告完整性的显著影响。受限于所报告的数据,研究仅能提供平均疗效估计,无法基于个体特征进行精准治疗推荐,无法分析联合用药、剂型差异、治疗反应一致性、成本-效益等问题,从而影响结果的全面性与外推性。因此,NMA的结论高度依赖于所纳入原始研究的质量、报告完整性与同质性,且间接比较在因果效应推断上仍弱于设计良好的直接比较。未来应重视此类证据综合结果与高质量直接比较研究、真实世界数据等多源证据的整合与相互验证,从而构建更全面、稳健的临床决策证据体系。
3 结语
系统评价与Meta分析作为证据合成的核心方法,在循证决策中发挥着重要作用。随着研究方法学的不断发展,NMA、DRMA、IPD-MA等延伸方法拓展了证据合成的深度与广度。与此同时,人工智能技术的引入为提升传统研究流程的效率带来了新的机遇。
然而,当前该领域仍面临挑战。例如,原始研究质量参差不齐可能影响结论的可靠性,报告规范不统一制约研究的透明度和可重复性,异质性的合理解读仍需更深入的方法学探索,人工智能工具在结果解释、逻辑推理等环节仍存在进步空间。未来应坚持方法学严谨性与技术创新并重,逐步实现从证据合成到决策支持的持续演进,提升证据在临床实践和卫生决策中的实用价值。
利益冲突声明:作者声明本研究不存在任何经济或非经济利益冲突。
1.李幼平, 刘雪梅. 系统评价的起源、发展和作用[J]. 中国循证医学杂志, 2011, 11(1): 2-6. [Li YP, Liu XM. History, progress and role of systematic review[J]. Chinese Journal of Evidence-Based Medicine, 2011, 11(1): 2-6.] DOI: 10.3969/j.issn.1672-2531.2011.01.002.
2.Egger M, Smith GD, Altman DG. Systematic reviews in health care: Meta-analysis in context[M]. London: BMJ Books, 2001: 1-16.
3.Cumpston M, Flemyng E, Thomas J, et al. Chapter l: Introduction[EB/OL]. (2023-08) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook/PDF/v6.5/chapter-ionlinepdfv65.
4.Smith MC, Naftel DC. Meta-analysis: a perspective for research synthesis[J]. Image J Nurs Sch, 1984, 16(1): 9-13. DOI: 10.1111/j.1547-5069.1984.tb01375.x.
5.Glass GV. Primary, secondary, and Meta-analysis of research[J]. Educ Researcher, 1976, 5: 3-8. DOI: 10.3102/0013189X0050 10003.
6.Thacker SB. Meta-analysis: a quantitative approach to research integration[J]. JAMA, 1988, 259(11): 1685-1689. DOI: 10.1001/jama.259.11.1685.
7.张伶俐, 主编. 循证药学[M]. 北京: 高等教育出版社, 2025: 129-138.
8.L'Abbé KA, Detsky AS, O'Rourke K. Meta-analysis in clinical research[J]. Ann Intern Med, 1987, 107(2): 224-233. DOI: 10.7326/0003-4819-107-2-224.
9.吴昀效, 颜济南, 聂晓璐, 等. 《中国药物流行病学研究方法学指南(第2版)》及其系列解读(1): 概述[J]. 药物流行病学杂志, 2025, 34(1): 2-11. [Wu YX, Yan JN, Nie XL, et al. Guide on Methodological Standards in Pharmacoepidemiology in China (2nd edition) and their series interpretation (1): an overview[J]. Chinese Journal of Pharmacoepidemiology, 2025, 34(1): 2-11.] DOI: 10.12173/j.issn.1004-5511.202412131.
10.Cochrane A, Editor C. Effectiveness and efficiency: random reflections on health services[M]. London: Nuffield Provincial Hospitals Trust, 1972: 2-7.
11.Cochrane A. A critical review, with particular reference to the medical profession. In Medicines for the year 2000[M]. London: Office of Health Economics, 1979: 1-11.
12.Furberg CD. Effect of antiarrhythmic drugs on mortality after myocardial infarction[J]. Am J Cardiol, 1983, 52(6): 32C-36C. DOI: 10.1016/0002-9149(83)90629-X.
13.李幼平, 主编. 循证医学[M]. 北京: 人民卫生出版社, 2014: 56-58.
14.Li T, Higgins JPT, Deeks JJ. Chapter 5: Collecting data[EB/OL]. (2019-10) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook/PDF/v6.5/chapter05 colonlinepdfv65.
15.郑卿勇, 徐彩花, 周泳佳, 等. 《药物流行病学研究方法学指南(第2版)》系列解读(10): 质量评估工具介绍与案例分析 [J]. 药物流行病学杂志, 2025, 34(10): 1113-1126. [Zheng QY, Xu CH, Zhou YJ, et al. Guide on Methodological Standards in Pharmacoepidemiology (2nd edition) and their series interpretation (10): an overview and case study of quality assessment tools[J]. Chinese Journal of Pharmacoepidemiology, 2025, 34(10): 1113-1126.] DOI: 10.12173/j.issn.1005-0698. 202509141.
16.Higgins JPT, Li T, Deeks JJ. Chapter 6: Choosing effect measures and computing estimates of effect[EB/OL]. (2023-08) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook/PDF/v6.5/chapter06effonlinepdfv65.
17.Deeks JJ, Higgins JPT, Altman DG, et al. Chapter 10: Analysing data and undertaking Meta-analyses[EB/OL]. (2024-11) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook/PDF/v6.5/chapter10metonlinepdfv65.
18.Deeks JJ, Bossuyt PM. Chapter 2: Evaluating medical tests[EB/OL]. (2023-07) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook-systematic-reviews-diagnostic-test-accuracy/chapter-pdfs-cochrane-handbook-systematic-reviews-diagnostic-test-accuracy-v20/2-evaluating-diagnostic-tests.
19.Deeks JY, Bossuyt PM, Leeflang MM, et al. Cochrane handbook for systematic reviews of diagnostic test accuracy. 1st edition[EB/OL]. (2023-07) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook-systematic-reviews-diagnostic-test-accuracy/chapter-pdfs-cochrane-handbook-systematic-reviews-diagnostic-test-accuracy-v20.
20.陆瑶, 杨秋玉, 刘雅菲, 等. 如何制作诊断试验准确性比较的系统评价与Meta分析[J]. 中国循证医学杂志, 2022, 22(11): 1339-1347. [Lu Y, Yang QY, Liu YF, et al. How to conduct a systematic review and Meta-analysis of comparative diagnostic test accuracy[J]. Chinese Journal of Evidence-Based Medicine, 2022, 22(11): 1339-1347.] DOI: 10.7507/1672-2531.202206024.
21.杨楠, 邓围,陈耀龙, 等. GRADE在预后研究系统评价中应用的原理、方法及挑战[J]. 中国循证医学杂志, 2015, 15(9): 1112-1116. [Yang N, Deng W, Chen YL, et al. Rationales, methods and challenges of using GRADE in systematic review of prognostic studies[J]. Chinese Journal of Evidence-Based Medicine, 2015, 15(9): 1112-1116.] DOI: 10.7507/1672-2531.20150184.
22.Flemming K, Booth A, Garside R, et al. Qualitative evidence synthesis for complex interventions and guideline development: clarification of the purpose, designs and relevant methods[J]. BMJ Glob Health, 2019, 4(Suppl 1): e000882. DOI: 10.1136/bmjgh-2018-000882.
23.Noyes J, Booth A, Cargo M, et al. Chapter 21: Qualitative evidence[EB/OL]. (2019-10) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook/PDF/v6.5/chapter21qalonlinepdfv65.
24.Booth A, Noyes J, Flemming K, et al. Structured methodology review identified seven (RETREAT) criteria for selecting qualitative evidence synthesis approaches[J]. J Clin Epidemiol, 2018, 99: 41-52. DOI: 10.1016/j.jclinepi.2018.03.003.
25.Lin CY, Lin WH, Shu BC. A brief introduction to mixed methods systematic review (MMSR)[J]. Hu Li Za Zhi, 2023, 70(3):75-84. DOI: 10.6224/JN.202306_70(3).10.
26.Stern C, Lizarondo L, Carrier J, et al. Methodological guidance for the conduct of mixed methods systematic reviews[J]. JBI Evid Implement, 2021, 19(2):120-129. DOI: 10.1097/XEB.0000000000000282.
27.陈红丽, 丁晓彤, 王青, 等. 混合方法研究系统评价的方法学及应用进展[J]. 中华护理杂志, 2024, 59(21): 2665-2671. [Chen HL, Ding XT, Wang Q, et al. Methodological and application progress of systematic reviews of mixed methods research[J]. Chinese Journal of Nursing, 2024, 59(21): 2665-2671.] DOI: 10.3761/j.issn.0254-1769.2024.21.016.
28.Chaimani A, Caldwell D, Li T, et al. Chapter 11: Undertaking network Meta-analyses[EB/OL]. (2019-10) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook/PDF/v6.5/chapter11nmaonlinepdfv65.
29.Cipriani A, Furukawa TA, Salanti G, et al. Comparative efficacy and acceptability of 21 antidepressant drugs for the acute treatment of adults with major depressive disorder: a systematic review and network Meta-analysis[J]. Lancet, 2018, 391(10128): 1357-1366. DOI: 10.1016/S0140-6736(17)32802-7.
30.Caldwell DM, Dias S, Welton NJ. Extending treatment networks in health technology assessment: how far should we go?[J]. Value Health, 2015, 18(5): 673-681. DOI: 10.1016/j.jval.2015.03.1792.
31.李伦, 田金徽, 姚亮, 等. 网状Meta分析的统计学基础、假设和证据质量评估[J]. 循证医学, 2015, 15(3): 180-183. [Li L, Tian JH, Yao L, et al. The classification, statistical methods, assumption and evidence quality assessment of network Meta-analysis[J]. Journal of Evidence-Based Medicine, 2015, 15(3): 180-183.] DOI: 10.3969/j.issn.1671-5144.2015.03.015.
32.刘凤琪, 杨智荣, 武珊珊, 等. 效应修饰作用分析方法与案例解析系列(二): 网状Meta分析中的效应修饰[J]. 中华流行病学杂志, 2024, 45(2): 273-278. [Liu FQ, Yang ZR, Wu SS, et al. Analysis methods and case analysis of effect modification (2): effect modification in network Meta-analysis[J]. Chinese Journal of Epidemiology, 2024, 45(2): 273-278.] DOI: 10.3760/cma.j.cn112338-20230824-00094.
33.郑卿勇, 李腾飞, 许建国, 等. 网状Meta分析原理与主流软件包介绍[J]. 中国循证医学杂志, 2025, 25(6): 715-723. [Zheng QY, Li TF, Xu JG, et al. Principles of network Meta-analysis and applications of mainstream software packages[J]. Chinese Journal of Evidence-Based Medicine, 2025, 25(6): 715-723.] DOI: 10.7507/1672-2531.202407073.
34.Pitre T, Abdali D, Chaudhuri D, et al. Corticosteroids in community-acquired bacterial pneumonia: a systematic review, pairwise and dose-response Meta-analysis[J]. J Gen Intern Med, 2023, 38(11): 2593-2606. DOI: 10.1007/s11606-023-08203-6.
35.郭鹏, 周权, 谷万杰, 等. 剂量-反应Meta分析报告规范G-Dose Checklist的解读[J]. 中国循证医学杂志, 2017, 17(6): 736-741. [Guo P, Zhou Q, Gu WJ, et al. Interpretation of reporting guideline for dose-response Meta-analysis-G-Dose Checklist[J]. Chinese Journal of Evidence-Based Medicine, 2017, 17(6): 736-741.] DOI: 10.7507/1672-2531.201612086.
36.Berlin JA, Longnecker MP, Greenland S. Meta-analysis of epidemiologic dose-response data[J]. Epidemiology, 1993, 4(3): 218-228. DOI: 10.1097/00001648-199305000-00005.
37.Greenland S, Longnecker MP. Methods for trend estimation from summarized dose-response data, with applications to Meta-analysis[J]. Am J Epidemiol, 1992, 135(11): 1301-1309. DOI: 10.1093/oxfordjournals.aje.a116237.
38.Shim SR, Lee J. Dose-response Meta-analysis: application and practice using the R software[J]. Epidemiol Health, 2019, 41: e2019006. DOI: 10.4178/epih.e2019006.
39.Zhang C, Jia P, Yu L, et al. Introduction to methodology of dose-response Meta-analysis for binary outcome: with application on software[J]. J Evid Based Med, 2018, 11(2): 125-129. DOI: 10.1111/jebm.12267.
40.Xu C, Doi SAR. The robust error Meta-regression method for dose-response Meta-analysis[J]. Int J Evid Based Healthc, 2018, 16(3): 138-144. DOI: 10.1097/XEB.0000000000000132.
41.蒋青青, 王世琦, 黄申, 等. 剂量反应Meta分析中常见的统计学问题[J]. 数理医药学杂志, 2023, 36(2): 81-87. [Jiang QQ, Wang SQ, Huang S, et al. Common statistical problems in dose-response Meta-analysis[J]. Journal of Mathematical Medicine, 2023, 36(2): 81-87.] DOI: 10.12173/j.issn.1004-5511. 202212019.
42.Tierney JF, Stewart LA, Clarke M. Chapter 26: Individual participant data[EB/OL]. (2019-10) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook/PDF/v6.5/chapter26ipdonlinepdfv65.
43.Nagendran M, Russell JA, Walley KR, et al. Vasopressin in septic shock: an individual patient data Meta-analysis of randomised controlled trials[J]. Intensive Care Med, 2019, 45(6): 844-855. DOI: 10.1007/s00134-019-05620-2.
44.Huang Y, Tang J, Tam WW, et al. Comparing the overall result and interaction in aggregate data Meta-analysis and individual patient data Meta-analysis[J]. Medicine (Baltimore), 2016, 95(14): e3312. DOI: 10.1097/MD.0000000000003312.
45.Stewart LA, Parmar MK. Meta-analysis of the literature or of individual patient data: is there a difference?[J]. Lancet, 1993, 341(8842): 418-422. DOI: 10.1016/0140-6736(93)93004-K.
46.Simmonds MC, Higgins JP, Stewart LA, et al. Meta-analysis of individual patient data from randomized trials: a review of methods used in practice[J]. Clin Trials, 2005, 2(3): 209-217. DOI: 10.1191/1740774505cn087oa.
47.Spence GT, Steinsaltz D, Fanshawe TR. A Bayesian approach to sequential Meta-analysis[J]. Stat Med, 2016, 35(29): 5356-5375. DOI: 10.1002/sim.7052.
48.Van der Tweel I, Bollen C. Sequential Meta-analysis: an efficient decision-making tool[J]. Clin Trials, 2010, 7(2): 136-146. DOI: 10.1177/1740774509360994.
49.Bolland MJ, Grey A, Gamble GD, et al. Vitamin D supplementation and falls: a trial sequential Meta-analysis[J]. Lancet Diabetes Endocrinol, 2014, 2(7): 573-580. DOI: 10.1016/S2213-8587(14)70068-3.
50.翁鸿, 武珊珊, 张永刚, 等. 序贯Meta分析方法学简介[J]. 中国循证医学杂志, 2016, 16(10): 1216-1220. [Weng H, Wu SS, Zhang YG, et al. Brief introduction of methodology of sequential Meta-analysis[J]. Chinese Journal of Evidence-Based Medicine, 2016, 16(10): 1216-1220.] DOI: 10.7507/1672- 2531.20160184.
51.Wetterslev J, Thorlund K, Brok J, et al. Trial sequential analysis may establish when firm evidence is reached in cumulative Meta-analysis[J]. J Clin Epidemiol, 2008, 61(1): 64-75. DOI: 10.1016/j.jclinepi.2007.03.013.
52.Higgins JP, Whitehead A, Simmonds M. Sequential methods for random-effects Meta-analysis[J]. Stat Med, 2011, 30(9): 903-921. DOI: 10.1002/sim.4088.
53.Watt CA, Kennedy JE. Options for prospective Meta-analysis and introduction of registration-based prospective Meta-analysis[J]. Front Psychol, 2016, 7: 2030. DOI: 10.3389/fpsyg.2016.02030.
54.Seidler AL, Hunter KE, Cheyne S, et al. A guide to prospective Meta-analysis[J]. BMJ, 2019, 367: l5342. DOI: 10.1136/bmj.l5342.
55.Baigent C, Keech A, Kearney PM, et al. Efficacy and safety of cholesterol-lowering treatment: prospective Meta-analysis of data from 90,056 participants in 14 randomised trials of statins[J]. Lancet, 2005, 366(9493): 1267-1278. DOI: 10.1016/S0140-6736(05)67394-1.
56.Shojania KG, Sampson M, Ansari MT, et al. How quickly do systematic reviews go out of date? a survival analysis[J]. Ann Intern Med, 2007, 147(4): 224-233. DOI: 10.7326/0003-4819-147-4-200708210-00179.
57.Cumpston M, Flemyng E. Chapter IV: Updating a review[EB/OL]. (2023-08) [2025-12-26]. https://www.cochrane.org/authors/handbooks-and-manuals/handbook/PDF/v6.5/chapter-ivonlinepdfv65.
58.Smith GD, Ho K. Systematic reviews: when should they be updated?[J]. J Clin Nurs, 2023, 32(9-10): e17-e18. DOI: 10.1111/jocn.16547.
59.Garner P, Hopewell S, Chandler J, et al. When and how to update systematic reviews: consensus and checklist[J]. BMJ, 2016, 354: i3507. DOI: 10.1136/bmj.i3507.
60.Elliott JH, Synnot A, Turner T, et al. Living systematic review: 1. Introduction-the why, what, when, and how[J]. J Clin Epidemiol, 2017, 91: 23-30. DOI: 10.1016/j.jclinepi.2017.08.010.
61.Augustin Y, Staines HM, Velavan TP, et al. Drug repurposing for COVID-19: current evidence from randomized controlled adaptive platform trials and living systematic reviews[J]. Br Med Bull, 2023, 147(1): 31-49. DOI: 10.1093/bmb/ldac037.
62.Thomas J, Noel-Storr A, Marshall I, et al. Living systematic reviews: 2. Combining human and machine effort[J]. J Clin Epidemiol, 2017, 91: 31-37. DOI: 10.1016/j.jclinepi.2017. 08.011.
63.Schmidt L, Sinyor M, Webb RT, et al. A narrative review of recent tools and innovations toward automating living systematic reviews and evidence syntheses[J]. Z Evid Fortbild Qual Gesundhwes, 2023, 181: 65-75. DOI: 10.1016/j.zefq.2023.06.007.
64.Khan MA, Ayub U, Naqvi S, et al. Collaborative large language models for automated data extraction in living systematic reviews[J/OL]. medRxiv, 2025: 2025-02-13. DOI: 10.1101/2024.09.20. 24314108.
65.Fuller-Tyszkiewicz M, Jones A, Vasa R, et al. Artificial intelligence software to accelerate screening for living systematic reviews[J/OL]. Clin Child Fam Psychol Rev, 2025: 2025-04-18. DOI: 10.1007/s10567-025-00519-5.
66.Peters MDJ, Godfrey C, McInerney P, et al. JBI manual for evidence synthesis[EB/OL]. (2024-03-27) [2025-12-26]. https://jbi-global-wiki.refined.site/space/MANUAL/4685837/JBI+Manual+for+Evidence+Synthesis.
67.刘晏利, 吴才志, 王浙, 等. JBI范围综述执行流程简介 [J]. 中国循证医学杂志, 2024, 24(8): 986-992. [Liu YL, Wu CZ, Wang Z, et al. An introduction of the JBI scoping review execution process[J]. Chinese Journal of Evidence-Based Medicine, 2024, 24(8): 986-992.] DOI: 10.7507/1672-2531.202311060.
68.Peters MD, Godfrey CM, Khalil H, et al. Guidance for conducting systematic scoping reviews[J]. Int J Evid Based Healthc, 2015, 13(3): 141-146. DOI: 10.1097/XEB.0000000000000050.
69.Levac D, Colquhoun H, O'Brien KK. Scoping studies: advancing the methodology[J]. Implement Sci, 2010, 5: 69. DOI: 10.1186/1748-5908-5-69.
70.David C, Elizalde-Hernández A, Barboza AS, et al. Cannabidiol in dentistry: a scoping review[J]. Dent J (Basel), 2022, 10(10): 193. DOI: 10.3390/dj10100193.
71.Munn Z, Peters M, Stern C, et al. Systematic review or scoping review? Guidance for authors when choosing between a systematic or scoping review approach[J]. BMC Med Res Methodol, 2018, 18(1): 143. DOI: 10.1186/s12874-018-0611-x.
72.Hamel C, Michaud A, Thuku M, et al. Defining rapid reviews: a systematic scoping review and thematic analysis of definitions and defining characteristics of rapid reviews[J]. J Clin Epidemiol, 2021, 129: 74-85. DOI: 10.1016/j.jclinepi.2020.09.041.
73.李苗苗, 张乐, 吴雪, 等. 医学研究领域快速综述实施和报告标准介绍及应用分析[J]. 中国中西医结合杂志, 2024, 44(11): 1320-1329. [Li MM, Zhang L, Wu X, et al. Introduction and application of standards for conducting and reporting rapid reviews in healthcare research[J]. Journal of Integrated Traditional and Western Medicine, 2024, 44(11): 1320-1329.] DOI: 10.7661/j.cjim.20240625.135.
74.Harker J, Kleijnen J. What is a rapid review? a methodological exploration of rapid reviews in health technology assessments[J]. Int J Evid Based Healthc, 2012, 10(4): 397-410. DOI: 10.1111/j.1744-1609.2012.00290.x.
75.Garritty C, Hamel C, Trivella M, et al. Updated recommendations for the Cochrane rapid review methods guidance for rapid reviews of effectiveness[J]. BMJ, 2024, 384: e76335. DOI: 10.1136/bmj-2023-076335.
76.Garritty C, Gartlehner G, Nussbaumer-Streit B, et al. Cochrane Rapid Reviews Methods Group offers evidence-informed guidance to conduct rapid reviews[J]. J Clin Epidemiol, 2021, 130: 13-22. DOI: 10.1016/j.jclinepi.2020.10.007.
77.李苗苗, 吴雪, 景城阳, 等. 快速综述在医学研究领域应用现状的文献计量学分析[J]. 中国全科医学, 2024, 27(33): 4215-4224. [Li MM, Wu X, Jing CY, et al. The application of rapid review in the field of medical research: a bibliometric analysis[J]. Chinese General Practice, 2024, 27(33): 4215-4224.] DOI: 10.12114/j.issn.1007-9572.2023.0358.
78.Tóth B, Berek L, Gulácsi L, et al. Automation of systematic reviews of biomedical literature: a scoping review of studies indexed in PubMed[J]. Syst Rev, 2024, 13(1): 174. DOI: 10.1186/s13643-024-02592-3.
79.郑卿勇, 周泳佳, 张梦君, 等. 人工智能推动系统评价与Meta分析自动化工具发展[J]. 中国循证医学杂志, 2025, 25(11): 1340-1349. [Zheng QY, Zhou YJ, Zhang MJ, et al. Artificial intelligence promotes the development of automated tools for systematic reviews[J]. Chinese Journal of Evidence-Based Medicine, 2025, 25(11): 1340-1349.] DOI: 10.7507/1672-2531.202501115.
80.郭玉杰, 张雪芹, 孙文宇, 等. 自动化文献筛选工具在系统评价中的应用[J]. 协和医学杂志, 2024, 15(4): 921-926. [Guo YJ, Zhang XQ, Sun WY, et al. Application of automated literature screening tools in systematic reviews[J]. Medical Journal of Peking Union Medical College Hospital, 2024, 15(4): 921-926.] DOI: 10.12290/xhyxzz.2023-0257.
81.Noel-Storr A, Dooley G, Elliott J, et al. An evaluation of Cochrane Crowd found that crowdsourcing produced accurate results in identifying randomized trials[J]. J Clin Epidemiol, 2021, 133: 130-139. DOI: 10.1016/j.jclinepi.2021.01.006.
82.Marshall IJ, Noel-Storr A, Kuiper J, et al. Machine learning for identifying randomized controlled trials: an evaluation and practitioner's guide[J]. Res Synth Methods, 2018, 9(4): 602-614. DOI: 10.1002/jrsm.1287.
83.Thomas J, Brunton J, Graziosi S. EPPI-Reviewer 4.0: software for research synthesis[Z]. London: EPPI-Centre, Social Science Research Unit, Institute of Education, University of London, 2011.
84.Wallace BC, Small K, Brodley CE, et al. Deploying an interactive machine learning system in an evidence-based practice center[C]. Miami, FL: Proceedings of the 2nd ACM SIGHIT International Health Informatics Symposium, 2012.
85.Ouzzani M, Hammady H, Fedorowicz Z, et al. Rayyan-a web and mobile app for systematic reviews[J]. Syst Rev, 2016, 5(1): 210. DOI: 10.1186/s13643-016-0384-4.
86.Howard BE, Phillips J, Tandon A, et al. SWIFT-active screener: accelerated document screening through active learning and integrated recall estimation[J]. Environ Int, 2020, 138: 105623. DOI: 10.1016/j.envint.2020.105623.
87.Przybyła P, Brockmeier AJ, Kontonatsios G, et al. Prioritising references for systematic reviews with RobotAnalyst: a user study[J]. Res Synth Methods, 2018, 9(3): 470-488. DOI: 10.1002/jrsm.1311.
88.Cheng SH, Augustin C, Bethel A, et al. Using machine learning to advance synthesis and use of conservation and environmental evidence[J]. Conserv Biol, 2018, 32(4): 762-764. DOI: 10.1111/cobi.13117.
89.Rens Van De Schoot JDBR. An open source machine learning framework for efficient and transparent systematic reviews[J]. Nat Mach Intell, 2021, 3: 125-133. DOI: 10.1038/s42256-020-00287-7.
90.Khalil H, Ameen D, Zarnegar A. Tools to support the automation of systematic reviews: a scoping review[J]. J Clin Epidemiol, 2022, 144: 22-42. DOI: 10.1016/j.jclinepi.2021.12.005.
91.Karlsson WK, Ostinelli EG, Zhuang ZA, et al. Comparative effects of drug interventions for the acute management of migraine episodes in adults: systematic review and network Meta-analysis[J]. BMJ, 2024, 386: e80107. DOI: 10.1136/bmj-2024-080107.