机器学习辅助处方合理性预测模型在围手术期合理用药管理中的应用-在线期刊

机器学习辅助处方合理性预测模型在围手术期合理用药管理中的应用

更新时间：2024年12月01日阅读：3736次下载：745次 下载 手机版

作者单位： 1. 山西医科大学附属运城市中心医院药学部（山西运城 044000） 2. 山西医科大学第一医院药学部（太原 030001）

DOI： 10.12173/j.issn.1005-0698.202409026

引用格式：樊丽娟，张智琪，程晓军，岳秀楠，成海燕，尚楠.机器学习辅助处方合理性预测模型在围手术期合理用药管理中的应用[J]. 药物流行病学杂志,2024, 33(11):1219-1228.DOI: 10.12173/j.issn.1005-0698.202409026.  已复制

FAN Lijuan, ZHANG Zhiqi, CHENG Xiaojun,YUE xiunan, CHENG Haiyan, SHANG Nan.Application of a machine learning-assisted prescription rationality prediction model in perioperative rational drug use management[J].Yaowu Liuxingbingxue Zazhi,2024, 33(11):1219-1228.DOI: 10.12173/j.issn.1005-0698.202409026.[Article in Chinese]  已复制

摘要|Abstract
全文|Full-text
参考文献|References

摘要| Abstract

目的探讨围手术期合理用药的影响因素，并基于机器学习建立处方合理性预测模型，以辅助药师审核处方。

方法回顾性分析2021年3月至2023年3月山西省某三甲医院和某中心医院神经外科围手术期患者的处方数据。通过单因素分析和多因素Logistic回归模型分析筛选影响合理用药的因素，并结合Lasso回归和多重共线性分析筛选出重要变量，将数据按照7 ∶ 3的比例分成训练集和测试集，构建基于决策树（DT）、多层感知器（MLP）、极限梯度提升（XGBoost）、支持向量机（SVM）和随机森林（RF）5种机器学习算法的处方合理性预测模型。

结果共纳入1 500条处方，其中合理处方668条，不合理处方832条。在训练集和测试集中，DT、XGBoost和RF模型的受试者工作特征曲线下面积值均超过0.9，其中DT模型的敏感性最高（0.81），RF模型的特异性最高（0.90）。在RF模型中，合并症数、术前等待天数、住院总费用、开方医师职称和不良反应发生情况对处方合理性呈负向影响，同时开具药品数、年龄和给药途径则对处方合理性呈正向影响。

结论基于机器学习的处方合理性预测模型具有良好的预测性能，能有效辅助药师进行处方审核，有助于降低不合理用药的发生率。

全文| Full-text

随着医疗技术不断进步和临床药学迅速发展，合理用药已成为医疗质量管理的重要组成部分[1]。国家卫生健康委、国家中医药管理局印发的《关于进一步加强用药安全管理提升合理用药水平的通知》为药师充分发挥指导合理用药的作用提供了制度保障[2]。处方合理性不仅关系到患者的治疗效果和安全性，还影响到医疗资源的合理利用[3]。高效准确地评估处方合理性，是当前临床药学的重要任务[4]。围手术期患者由于个体差异、手术类型和并发症风险等不同，使得药物治疗方案异常复杂[5]。传统的处方合理性评估方法（处方审核）主要依赖于药师的专业判断和经验，不仅耗时耗力，而且存在主观性强、标准不一等问题[6]。随着医疗数据激增和药物治疗方案复杂性增加，仅靠药师手工审核已无法满足实际需求。

人工智能技术的快速发展，尤其是机器学习在医疗数据分析中的广泛应用，为处方合理性评估提供了新的思路和方法[7]。机器学习算法能从大量复杂的医疗数据中提取有效信息[8]，自动识别和预测潜在的不合理用药风险；通过构建基于数据的预测模型，可以在处方审核中为药师提供科学的辅助决策工具，提升审核效率和准确性，确保患者用药的安全性和有效性。基于此，本研究旨在利用机器学习技术，建立神经外科围手术期处方合理性的预测模型，通过对患者基本情况、临床用药数据和手术特征的分析，探索患者围手术期可能面临的药物治疗风险，以促进合理用药。

1 资料与方法

1.1 处方合理性评价标准

处方数据来自山西省两家三甲医院的电子处方审核系统，该审核系统嵌入了由临床药师、医师、护士和医院管理人员组成的跨学科专家组利用药品说明书、专著、文献以及医院药物使用实践和行政法规等各种来源的证据建立的规则库。医师下达的处方首先通过审核系统自动审核并评定处方等级，共分8个等级：0~4级，系统判定合理进入调配流程；5~6级，为存在潜在用药错误（potential medication errors，PMEs），将转移至审方药师界面进行人工审核；7级，系统判定为不合理，拒绝调配并直接返回给开方医师。药师依据国家及行业权威指南、相关文献以及医院内部的临床药学规范，对5~6级处方进行人工审核，具体包括：①参与本研究的所有审核人员均接受统一的专业培训，确保其对评价标准的理解和应用保持一致；②每条处方均由2名审核人员独立评价，若存在分歧，由第3方专家组进行裁定；③研究团队定期召开质控会议，讨论审核过程中遇到的问题和争议，确保评价过程的持续改进和标准的一致性。

在制定适用于临床实际情况的规则时，若规则过于严格，临床用药会失去很多可使患者获益的选择；若规则过于宽松，药剂师所面临的时间限制和繁重的工作负荷可能成为有效解决围手术期PMEs的障碍，而基于机器学习的处方合理性预测模型可以自动识别和预测潜在的不合理用药风险，使得药师更加关注高风险的不合理处方，提高处方审核效率[9]。

1.2 资料提取

回顾性收集2021年3月至2023年3月山西省两家三甲医院收治的神经外科手术患者的处方数据。提取包括患者信息（年龄、性别、合并症数、住院天数、是否发生不良反应）、手术信息（手术类型、术前等待天数、手术等级）、处方信息（处方类型、药品类型、给药途径、处方等级、开方医师职称）、审核处方药师是否接受过培训、费用信息（药品费用、住院总费用）等相关变量。本研究已分别通过山西医科大学第一医院伦理委员会（批件号：K-K229）及山西医科大学附属运城市中心医院伦理委员会（批件号：YXLL2024090）审核，并同意豁免患者知情同意。

纳入标准：①2021年3月至2023年3月在神经外科住院行手术治疗的患者处方；②被系统识别具有PMEs（处方被归类为5~6级），并转移到审方药师界面进行进一步审核的处方。排除标准：①数据资料缺失≥25%的处方；②未用药或未进行手术治疗的患者处方。

1.3 模型构建

1.3.1 变量选择

采用单因素分析筛选对处方不合理结局发生具有影响的自变量，将具有统计学意义的变量纳入多因素Logistic 回归模型。P＜0.05为具有统计学意义。采用Lasso回归分析方法进一步对变量进行筛选，Lasso回归在损失函数中添加1个L1惩罚项，将部分变量的系数压缩为0，从而实现自动特征选择。在Lasso回归中，系数为0的独立变量被排除在外，而系数非0的独立变量则被保留[10]。用方差膨胀因子（variance inflation factor，VIF）评估变量间是否存在多重共线性[11-12]。

1.3.2 模型建立

采用计算机随机分组方法将数据按照7 ∶ 3的比例分成训练集和测试集，训练集用于建立模型，测试集用于评估模型的性能。模型的开发采用决策树（decision tree，DT）、多层感知器（multi-layer perceptron，MLP）、极限梯度提升（extreme gradient boosting，XGBoost）、支持向量机（support vector machine，SVM）和随机森林（random forest，RF）5种机器学习算法[10]。在训练集上进行五折交叉验证，对模型进行内部验证。

1.3.3 模型验证

为评估5种机器学习模型在预测神经外科围手术期患者处方合理性方面的性能和泛化能力，使用受试者工作特征曲线下面积（area under curve，AUC）、准确率、敏感性、特异性、F1值等指标来评估模型的预测性能，使用SHapley Additive exPlanations（SHAP）解释变量对模型的贡献[13]。采用决策曲线分析（decision curve analysis，DCA）诊断模型临床效用[14]。

所有机器学习建模过程均采用Python 3.7软件完成。

1.4 统计学分析

采用SPSS 26.0软件进行统计分析。符合正态分布的计量资料以表示，组间比较采用独立样本t检验；不符合正态分布的计量资料以M（P₂₅，P₇₅）表示，组间比较采用Wilcoxon秩和检验。计数资料以n（%）表示，组间比较采用χ²检验或Fisher确切概率法。检验水准为α=0.05，所有检验均采用双侧检验。

2 结果

2.1 一般资料

最终纳入1 500条处方数据，其中合理处方668条，不合理处方832条。纳入处方中，年龄 ≤65岁的患者占比78.80%（n=1 182），男性患者占比高于女性（55.67% vs. 44.33%），患者合并症中位数为1（0，2），长期医嘱占比高于临时医嘱（71.73% vs. 28.27%），静脉给药（75.27%）是主要的给药途径，开颅或颅骨切除术（n=750，50.00%）及皮肤和深层组织手术（切开、引流、局部切除、皮肤移植）（n=252，16.80%）是最常见的手术类型，中位术前等待天数为5（3，9）d，主要的手术级别为4级（70.67%）和3级（16.60%），见表1。

表格1 山西省两家三级医院神经外科围手术期处方合理性相关因素分析[n（%）]

Table 1.Analysis of factors related to perioperative prescription appropriateness in neurosurgery departments of two tertiary hospitals in Shanxi province [n (%)]


2.2 处方合理性潜在影响因素筛选

根据处方是否合理，将因变量分为合理组与不合理组，对所有自变量进行单因素分析。结果显示，年龄、合并症数、是否发生药品不良反应、处方类型、同时开具药品数、给药途径、手术类型、术前等待天数、住院天数、住院总费用、药品费用等11个变量在两组间的差异有统计学意义（P＜0.05），见表2。

2.3 处方合理性相关因素Logistic回归分析

为提高模型的实用性和可操作性，对单因素分析中具有统计学意义的11个变量为自变量，以处方是否合理为因变量（合理=0，不合理=1）进行多因素Logistic回归分析。结果显示，年龄、合并症数、是否发生药品不良反应、处方类型、同时开具药品数、给药途径、术前等待天数、住院天数、住院总费用、药品费用等10个变量是处方合理性的独立影响因素（P＜0.05）。见表2。

表格2 山西省两家三级医院神经外科围手术期处方合理性的多因素Logistic分析

Table 2.Multivariate Logistic analysis of perioperative prescription appropriateness in neurosurgery departments of two tertiary hospitals in Shanxi province


2.4 建立机器学习模型

为进一步控制混杂因素，采用Lasso回归分析对16个变量进行深入选择。结果显示，由Lasso回归分析得出的特征选择结果与多因素Logistic回归分析获得的结果一致。10个变量的多重共线性分析显示，处方类型、住院天数、药品费用、住院总费用4个变量的VIF值高于10，剔除处方类型、住院天数、药品费用3个变量后，剩余7个因素之间不存在显著的多重共线性问题。同时根据临床药师的实际工作经验，认为开方医师职称对处方合理性也有影响，故最终将年龄、合并症数、是否发生不良反应、同时开具药品数、开方医师职称、给药途径、术前等待天数、住院总费用8个变量纳入机器学习模型。

本研究共开发了DT、MLP、XGBoost、SVM和RF 5种机器学习模型。结果显示，DT、XGBoost、RF模型在训练集和测试集中的AUC值均达到了0.9以上，见图1A。进一步检查模型评价指标发现，DT模型的敏感性最高（0.81），RF模型的特异性最高（0.90），见图1B、图1C和表3。表明DT和RF模型在各种性能参数方面各有优劣。描绘的DCA曲线进一步证明2个模型均具有较高的临床实用性，见图1D。

图1 5种模型的性能比较

Figure 1.Comparison of the performance of five models

注：A. 每个模型的ROC曲线；B. 每个模型通过交叉验证获得的AUC的95%置信区间；C. 每个模型评估指标的平行线图；D. 每个模型的DCA曲线。


表格3 5种模型的性能指标

Table 3.The predictive performance of five performing models


为确保全面理解所选变量，采用SHAP算法反映变量在处方合理性在RF 模型中的预测重要性。由图2A可知，在RF模型中，合并症数、术前等待天数、住院总费用发生情况、开方医师职称以及药品不良反应对处方合理性呈负向影响，同时开具药品数、年龄和非静脉给药途径对处方合理性呈正向影响。由图2B可以看出8个变量的层次结构，反映其在模型中的重要性，合并症数和住院总费用对结局影响最为重要，开方医师职称、术前等待天数、给药途径、药品数量、给药途径和年龄的重要性依次降低，是否发生药品不良反应的重要性最小。

图2 基于SHAP算法的RF模型

Figure 2.RF model based on SHAP algorithm

注：A. RF模型中的特征属性，其中每条线代表1个特征，横轴代表SHAP值，表示该特征对结果的影响；每个点代表一个样本，颜色越红，特征值越大；颜色越蓝，特征值越小；B. 特征的重要性排序。


3 讨论

本研究旨在通过多种机器学习模型的构建和评估影响神经外科围手术期处方合理性的因素，并为临床药师在实际工作中提供科学依据和参考。结果显示，DT、XGBoost和RF模型在预测处方合理性方面表现优异，表明机器学习方法在处方合理性评估中的潜在应用价值。

变量选择采用单因素分析和多因素Logistic回归分析，确定年龄、合并症数、是否发生不良反应、处方类型、同时开具药品数、给药途径、术前等待天数、住院天数、住院总费用和药品费用10个变量作为处方合理性的独立影响因素。进一步通过Lasso回归分析，剔除具有多重共线性的因素 [15-16]，即处方类型、住院天数和药品费用，同时根据临床药师的实际工作经验，纳入开方医师职称这一因素，最终确定了8个变量作为机器学习模型的输入特征。该过程确保了纳入模型变量的简洁性和准确性。

在模型性能评估中，DT模型显示了最高的敏感性，而RF模型则具有最高的特异性。DCA进一步验证了以上2个模型的临床实用性，表明在不同的阈值选择下，这些模型均能为临床决策提供有效支持。尤其是 DCA曲线的结果，反映出在真实临床环境中使用这些模型的潜力。

通过SHAP算法分析，合并症数增加、术前等待天数越长、住院总费用越高、开方医师职称越高以及发生药品不良反应被认为对处方合理性呈负向影响，住院总费用的增加往往是由于住院时间的延长导致的，开方医师职称的对处方合理性的影响似乎不太符合常理，这也可能是由于样本的偏差导致的。同时开具药品数越多、年龄越小和非静脉给药途径对处方合理性呈正向影响，同时开具药品数越多可能会使医师和药师对其关注增加，降低了处方不合理的可能性[17]。这些发现不仅有助于理解模型的决策过程，也为临床干预措施的制定提供了重要依据。例如，针对多合并症数和长住院时间的患者，应加强处方审核并给予更多的关注，以提高合理性。

本研究的结果与已有文献中关于处方合理性影响因素研究的结果一致。如倪清清等[18]的研究指出，患者年龄、住院时间、联合用药数是潜在不适当用药的独立影响因素，而本研究通过机器学习模型进一步量化了这些变量的影响程度和重要性。此外，本研究在处方合理性评估中引入SHAP算法，为变量重要性的解释提供了直观、透明的方法，在现有研究中尚属首次。

本研究也存在一定的局限性：①样本量相对较小，可能限制了模型的泛化能力；②纳入的变量虽然经过筛选，但仍可能存在其他未被纳入的重要影响因素。此外，模型的应用效果需在更大规模和不同类型的医疗机构中进一步验证。

综上，机器学习模型在处方合理性评估中具有重要应用价值，尤其是DT和RF模型在多种性能指标上均表现优异。未来研究应进一步扩展样本量和变量范围，并在不同临床环境中验证模型的适用性，以推动机器学习在药学领域的广泛应用。

参考文献| References

1.唐景财, 朱钊铭, 秦柳霄, 等. 临床药师在DRG背景下参与神经内科药事精细化管理的实践探索[J]. 中国药事, 2024, 38(5): 588-593. [Tang JC, Zhu ZM, Qin LX, et al. Exploring the practice of clinical pharmacists participating in fine management of neurology pharmacy under the background of DRG[J]. Chinese Pharmaceutical Affairs, 2024, 38(5): 588-593.] DOI: 10.16153/j.1002-7777.2024.05.011.

2.中华人民共和国卫生健康委中医药局. 关于进一步加强用药安全管理提升合理用药水平的通知（国卫医函[2022]122号）[EB/OL]. (2022-07-27) [2024-11-04]. https://www.gov.cn/zhengce/zhengceku/2022-07/30/content_5703604.htm.

3.苏艳, 文思莹, 董超. 神经外科中成药用药与处方审核的必要性[J]. 中医药管理杂志, 2024, 32(5): 99-101. DOI: 10.16690/j.cnki.1007-9203.2024.05.029.

4.李文撼. 临床药学服务对头孢菌素类药物治疗腹腔感染合理用药的影响[J]. 临床合理用药, 2024, 17(2): 133-135, 139. DOI: 10.15887/j.cnki.13-1389/r.2024. 02.039.

5.李丹滢, 邵腾飞, 李俐, 等. 临床路径中药物治疗方案的优化探索——以南京鼓楼医院帕金森病药物治疗路径为例[J]. 药物评价研究, 2023, 46(11): 2467-2473. [Li DY, Shao TF, Li L, et al. Exploration on optimization of drug treatment scheme in clinical pathway: a case study of drug treatment pathway for Parkinson's disease in Nanjing Drum Tower Hospital[J]. Drug Evaluation Research, 2023, 46(11): 2467-2473.] DOI: 10.7501/j.issn.1674-6376.2023.11.024.

6.蒋君好, 郑航, 严波. 临床药师队伍的现状、问题与建设措施[J]. 中国高等医学教育, 2024(3): 32-33, 36. DOI: 10.3969/i.issn.1002-1701.2024.03.012.

7.郑琰莉, 韩福海, 李舒玉, 等. 人工智能大模型在医疗领域的应用现状与前景展望[J]. 医学信息学杂志, 2024, 45(6): 24-29. [Zheng YL, Ham FH, Li SY, et al. Application status and prospect of artificial intelligence large models in medicine[J]. Journal of Medical Intelligence, 2024, 45(6): 24-29.] DOI: 10.3969/i.issn.1673 -6036.2024.06.005.

8.Sirocchi C, Bogliolo A, Montagna S. Medical-informed machine learning: integrating prior knowledge into medical decision systems[J]. BMC Med Inform Decis Mak, 2024, 24(Suppl 4): 186. DOI: 10.1186/s12911-024-02582-4.

9.Tully MP, Buchan IE. Prescribing errors during hospital inpatient care: factors influencing identification by pharmacists[J]. Pharm World Sci, 2009, 31(6): 682-688. DOI: 10.1007/s11096-009-9332-x.

10.Teng X, Han K, Jin W, et al. Development and validation of an early diagnosis model for bone metastasis in non-small cell lung cancer based on serological characteristics of the bone metastasis mechanism[J]. EClinicalMedicine, 2024, 72: 102617. DOI: 10.1016/j.eclinm.2024.102617.

11.Hu J, Xu J, Li M, et al. Identification and validation of an explainable prediction model of acute kidney injury with prognostic implications in critically ill children: a prospective multicenter cohort study[J]. EClinicalMedicine, 2024, 68: 102409. DOI: 10.1016/j.eclinm.2023.102409.

12.Haitovsky Y. Multicollinearity in regression analysis: comment[A]. The Review of Economics and Statistics[M]. Massachusetts, U.S.: MIT Press, 1969: 486-489. DOI: 10.2307/1926450.

13.Xiong Y, Liu YM, Hu JQ, et al. A personalized prediction model for urinary tract infections in type 2 diabetes mellitus using machine learning[J]. Front Pharmacol, 2023, 14: 1259596. DOI: 10.3389/fphar.2023.1259596.

14.王鑫, 廖彬, 李敏, 等. 融合LightGBM与SHAP的糖尿病预测及其特征分析方法[J]. 小型微型计算机系统, 2022, 43(9): 1877-1885. [Wang X, Liao B, Li M, et al. Combination of LightGBM and SHAP for diabetes prediction and feature analysis[J]. Journal of Chinese Computer Systems, 2022, 43(9): 1877-1885.] DOI: 10.20009/j.cnki.21-1106/TP.2021-0114.

15.Farrar DE, Glauber RR. Multicollinearity in regression analysis: the problem revisitedt[A]. The Review of Economics and Statistics[M]. Massachusetts, U.S.: MIT Press, 1969: 92-107. DOI: 10.2307/1937887.

16.Vatcheva KP, Lee M, McCormick JB, et al. Multicollinearity in regression analyses conducted in epidemiologic studies[J]. Epidemiology (Sunnyvale), 2016, 6(2): 227. DOI: 10.4172/2161-1165.1000227.

17.Wawruch M, Fialova D, Zikavska M, et al. Factors influencing the use of potentially inappropriate medication in older patients in Slovakia[J]. J Clin Pharm Ther, 2008, 33(4): 381-392. DOI: 10.1111/j.1365-2710.2008.00929.x.

18.倪清清, 王勇, 王娜, 等. 老年住院患者潜在不适当用药情况分析[J]. 中国临床保健杂志, 2024, 27(3): 394-398. [Ni QQ, Wang Y, Wang N, et al. Analysis of potential inappropriate medication use among elderly hospitalized patients[J]. Chinese Journal of Clinical Healthcare, 2024, 27(3): 394-398.] DOI: 10.3969/J.issn.1672-6790. 2024.03.025.