欢迎访问中南医学期刊社系列期刊网站!

中国科技核心期刊

中国科技论文统计源期刊

CACJ中国应用型扩展期刊

湖北医学精品期刊

湖北省医学优秀期刊

《中国学术期刊影响因子年报》统计源期刊

WHO西太平洋地区医学索引(WPRIM)收录期刊

美国化学文摘社(CAS)数据库收录期刊

中国药学会系列期刊

百度学术索引期刊

首页 在线期刊 2025年 第34卷,第8期 详情

基于 XGBoost 的他汀类药物用药者急性肝损伤预测模型的开发与验证

更新时间:2025年08月28日阅读:54次 下载:14次 下载 手机版

作者: 孟祥龙 1, 2 于玥琳 1, 2 孙烨祥 3 沈鹏 3 江志琴 4 朱宇 4 殷玥琪 3 詹思延 1, 2, 5 王胜锋 1, 2, 5

作者单位: 1. 北京大学公共卫生学院流行病与卫生统计学系(北京 100191) 2. 教育部重大疾病流行病学重点实验室(北京 100191) 3. 宁波市鄞州区疾病预防控制中心数据中心(浙江宁波 315100) 4. 宁波市鄞州区卫生健康局(浙江宁波 315100) 5. 北京大学人工智能研究院(北京 100191)

关键词: 他汀类药物 急性肝损伤 预测模型 极限梯度提升算法 代价敏感学习

DOI: 10.12173/j.issn.1005-0698.202502023

基金项目: 国家自然科学基金面上项目(82173616)

引用格式: 孟祥龙,于玥琳,孙烨祥,沈 鹏,江志琴,朱 宇,殷玥琪,詹思延,王胜锋. 基于 XGBoost 的他汀类药物用药者急性肝损伤预测模型的开发与验证[J]. 药物流行病学杂志, 2025, 34(8): 867-876. DOI: 10.12173/j.issn.1005-0698.202502023.

MENG Xianglong, YU Yuelin, SUN Yexiang, SHEN Peng, JIANG Zhiqin, ZHU Yu, YIN Yueqi, ZHAN Siyan, WANG Shengfeng. Development and validation of an XGBoost-based prediction model for acute liver injury in statin users[J]. Yaowu Liuxingbingxue Zazhi, 2025, 34(8): 867-876. DOI: 10.12173/j.issn.1005-0698.202502023.[Article in Chinese]

摘要| Abstract

目的  开发并验证预测模型以识别他汀类药物新用药者在180 d内发生急性肝损伤(ALI)的高风险个体,为临床早期干预提供依据。

方法  选取2010年1月1日—2021年10月31日在宁波市鄞州区域健康信息平台中具有诊疗记录的18岁及以上他汀类药物新用药者,按用药时间分为开发队列和时序验证队列。采用LASSO方法筛选预测变量,利用极限梯度提升(XGBoost)算法并结合代价敏感学习构建模型。通过Brier分数、Harrell's C指数和校准曲线评估模型性能。

结果  共纳入126 440例他汀类药物新用药者,其中开发队列90 542例,验证队列35 898例。首次用药后180 d内,共412例(0.33%)发生ALI,其中开发队列305例(0.34%),验证队列107例(0.30%)。最终模型纳入16个预测变量,涵盖人口学特征、生活方式、家族史、既往史、他汀类药物用药情况及合并用药情况。模型在内部验证中表现出良好的整体性能[Brier分数=0.004 3,95%CI(0.003 8,0.004 9)]、区分度[Harrell's C指数=0.761,95%CI(0.725,0.794)]和校准度。时序验证中,模型的性能同样良好[Brier分数=0.004 4,95%CI(0.003 6,0.005 2);Harrell's C指数=0.703,95%CI(0.614,0.781)]。

结论  本研究开发并验证的他汀类药物新用药者ALI预测模型,可为临床医生提供可靠的个体化风险评估工具,有助于实现风险分层并减少ALI的发生。

全文| Full-text

随着生活方式的改变和人口老龄化的加剧,高脂血症已成为全球范围内常见的代谢性疾病之一[1]。他汀类药物通过抑制肝脏中3-羟基-3-甲基戊二酰辅酶A还原酶活性以减少体内胆固醇的合成,是临床上高脂血症和心血管疾病治疗和预防的基础药物[2]。尽管他汀类药物在大多数患者中表现出良好的安全性和耐受性[3-4],但仍有可能引起一系列不良反应,其中急性肝损伤(acute liver injury,ALI)是较为严重的一种[5-7]。

他汀类药物引起的ALI虽然在临床上相对罕见,但其严重性不容忽视,我国也规定他汀类药物用药者应定期监测肝生化指标,以早期发现和预防可能的肝损伤[8]。ALI的发生通常与用药剂量、用药时间、个体差异等因素有关[9]。已有研究[10-11]表明,特定人群如老年人、有肝病史者、合并使用其他肝毒性药物者,更易发生他汀类药物诱发的ALI。此外,某些遗传因素也可能增加患者的肝损伤风险,如特定的基因多态性已被证实与他汀类药物引起的肌病和肝损伤有关[12-13]。鉴于ALI的发生具有显著的异质性,开发一种能更精准和全面预测ALI的模型显得尤为重要。目前已有预测他汀类药物不良反应的模型[14],但尚无专门针对ALI且被临床推荐使用的预测模型。本研究通过整合用药者的基本信息、用药情况和疾病史等临床常规指标,开发并验证一个预测模型,旨在帮助临床医师识别发生ALI风险较高的他汀类药物用药者,从而优化治疗方案,减少ALI的发生。

1 资料与方法

1.1 数据来源

数据来源于宁波市鄞州区区域健康信息平台,鄞州区是浙江省宁波市最大的市辖区,全区常住人口约136万,人口流动性较低[15]。该数据平台自2005年开启搭建,至2020年末,已有超98%的该区内常驻居民在平台内建档,累计涵盖当地超122万人口的多方面、纵向、完整的卫生信息,如基本人口学特征、疾病诊断随访、化验检查、处方、死因登记等[16]。本研究涉及的药物信息和疾病信息来源于鄞州区内所有医疗机构的门诊和住院记录。本研究已获得北京大学医学部伦理委员会审查批准(编号:IRB00001052-22010),并豁免患者知情同意。

1.2 研究对象

选取2010年1月1日—2021年10月31日在宁波市鄞州区域健康信息平台中具有诊疗记录的18岁及以上他汀类药物新用药者为研究对象,纳入标准:①2010年1月1日—2021年10月31日在宁波市鄞州区域健康信息平台中有门诊处方记录或住院医嘱记录中存在他汀类药物记录的新用药者;新用药者定义为数据库中记录的首次他汀类药物处方日期之前的180 d内无目标药品处方记录[17],且要求首次他汀类药物处方日期与数据库截止日期的时间差>180 d,以保证足够长的随访时间;②年龄≥18岁。排除标准:①重要变量缺失,如建档编号、建档状态等;②首次用药时年龄<18岁;③患有恶性肿瘤等严重疾病或他汀类药物禁忌证;④在首次处方日期前7 d内出现与目标结局相关的严重ALI诊断记录[18]。

研究对象从首次用药时开始随访,直至出现ALI结局、死亡或研究结束(2021年10月31日),以三者中最早发生的时间为准。

1.3 结局

参考药源性ALI不良反应因果关系评价方法[19]、药物性肝损伤诊治指南[20]和既往研究[21-22],ALI定义为满足以下任一条:①丙氨酸转氨酶(alanine aminotransferase,ALT)水平超过5倍正常值上限(upper limit of normal,ULN);②碱性磷酸酶(alkaline phosphatase,ALP)水平超过2倍ULN,且伴随γ-谷氨酰转肽酶(gamma glutamyl transpeptidase,GGT)升高;③ALT水平超过3倍ULN,且总胆红素(total bilirubin,TBIL)水平超过2倍ULN。为排除其他非药源性因素引起的肝损伤,要求以上生化指标异常的检查记录时间均需与末次他汀类药物用药记录间隔在180 d内。满足以上条件的首次生化指标检查日期记为ALI的发生时点。

1.4 预测变量

参考既往文献[23-24],本研究共纳入了6个维度的临床易于收集的变量,包括:人口学特征、生活方式、家族史、既往史和合并症、他汀类药物用药情况以及合并用药情况,共计34个变量。

1.5 统计学分析

采用R 4.3.2软件进行进行统计学分析。计量资料使用Kolmogorov-Smirnov 检验进行正态性检验,符合正态分布的连续变量以表示,2组间比较采用t检验;若不符合正态分布,则以M (P25,P75)表示,2组间比较采用Wilcoxon秩和检验;分类变量以n(%)表示,2组间比较采用χ2检验或Fisher精确性检验,等级资料比较采用秩和检验。检验水准为α=0.05,所有检验均采用双侧检验。

根据首次他汀类药物用药时点,以7 ∶ 3的比例将研究对象划分为开发队列(2010年1月1日—2017年12月31日)和时序验证队列(2018年1月1日—2021年10月31日)。缺失比例≥50%的预测变量不再纳入之后的分析。对于缺失比例 <50%的变量,采用基于链式方程的多重插补法处理缺失数据[25],共生成10组缺失数据,采用Rubin规则合并研究结果[26]。预测变量的缺失率在开发队列和验证队列中基本一致。

在开发队列中,采用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)方法筛选变量[27],通过十折交叉验证,选择使得LASSO-Cox模型误差在最小误差的一个标准误之内的最大值作为最优惩罚参数[28]。在开发队列中,以ALI结局的发生情况为分层变量,按照8 ∶ 2的比例随机划分为训练集和测试集。训练集用于极限梯度提升(extreme gradient boosting,XGBoost)模型开发,测试集用于评估模型的内部性能。XGBoost是一个快速学习框架,使用梯度提升决策树以优化损失函数,能高效地处理大规模数据集并具有较高的预测精度[29]。由于ALI的发生率较低,存在严重的类别不平衡问题,因此在模型训练中结合了代价敏感学习方法,将阳性结局误分类的代价设置为超参数,后续进行调整优化[30]。通过网格搜索结合十折交叉验证进行模型优化。

由于XGBoost模型只能提供相对风险的估计,而无法直接得出个体的绝对风险,本研究进一步估计ALI的基线风险,并计算个体的绝对风险,具体步骤如下[31]:①基于XGBoost模型计算个体的相对风险评分;②以风险评分为预测变量,拟合单因素Cox比例风险模型,计算绝对风险,即ALI的发生概率。从整体表现、区分度和校准度3个维度评价模型表现。使用Brier 分数评价模型的整体表现;使用Harrell's C指数和时间依赖性受试者工作特征(receiver operating characteristic,ROC)曲线评价模型的区分度,其中,Harrell's C指数的取值范围为0~1,C指数>0.7表明模型的区分度表现良好[32];使用校准曲线评价模型的校准度。

为了全面评估模型的表现,进行亚组分析,评估模型在不同用药种类和不同剂量人群中的性能。研究依据透明报告多变量预测模型个体预后或诊断标准(transparent reporting of a multivariable prediction model for individual prognosis or diagnosis,TRIPOD)进行报告[33]。

2 结果

2.1 研究对象的基本特征

共发现126 440例他汀类药物新用药者,其中,开发队列90 542例,验证队列35 898例,总用药达1 718 452人次,研究人群筛选流程图及数据集拆分见图1。首次用药类型为阿托伐他汀、辛伐他汀和瑞舒伐他汀者最多,分别62 880例(49.7%)、38 623例(30.5%)和21 408例(16.9%)。用药剂量方面,单次用药剂量≤10 mg、>10~20 mg和>20 mg的用药者分别为41 672例(33.0%)、54 354例(43.0%)和30 414例(24.1%)。药品剂型以片剂为主(99.7%),给药途径则主要为口服(97.3%)。此外,用药记录大部分来自门诊处方(97.9%),见表1。

  • 图1 研究人群筛选流程图及数据集拆分
    Figure 1.Flow chart of study population and dataset splitting

  • 表格1 开发队列和验证队列中发生ALI与未发生ALI的他汀类药物用药者特征比较[M(P25,P75),n(%)]
    Table 1.Comparison of characteristics between statin users with and without ALI in the development and validation cohorts [M (P25, P75), n (%)]
    注:CCI. 查尔森合并症指数(Charlson comorbidity index)。

研究人群平均随访时间为2.58人年。在首次用药180 d内,共有412例(0.33%)他汀类药物用药者发生ALI,其中,开发队列305例(0.34%),验证队列107例(0.30%)。

2.2 模型表现

经过LASSO-Cox正则化方法筛选变量后(图2),共纳入16个预测变量:性别、受教育程度、饮酒状况、锻炼强度、轻度肝损伤既往史、中重度肝损伤既往史、肾损伤既往史、心血管疾病既往史、查尔森合并症指数(Charlson comorbidity index,CCI)得分、既往用药史、既往用药类数、合并用药类数、他汀类药物用药类型、单次用药剂量、给药途径和药品记录来源。

  • 图2 LASSO-Cox模型筛选预测变量
    Figure 2.LASSO-Cox model for predictors selection
    注:A. 系数路径图;B. 交叉验证误差图。

网格搜索结合十折交叉验证确定XGBoost模型的最佳超参数,具体如下:学习率为0.19,最大深度为10,最小叶子节点样本数为1,子样本比例为0.9,列采样比例为1,最小分裂增益为0.1,阳性样本误分类代价为30。使用特征增益作为评价指标,对各个变量对模型预测的贡献进行了评估,前5位重要的变量如下:合并用药类数(0.193)、既往用药类数(0.171)、锻炼强度(0.098)、单次用药剂量(0.089)、CCI得分(0.088)。180 d时研究对象发生ALI的基线风险为0.001 9。

在内部验证中,模型的Brier分数为0.004 3 [95%CI(0.003 8,0.004 9)]。区分度方面,模型在180 d时的Harrell's C指数为0.761 [95%CI(0.725,0.794)],时间依赖性ROC曲线下面积为0.743 [95%CI(0.737,0.748)],表明模型具有良好的区分度。在时序验证中,模型同样表现出良好的性能,Brier分数为0.004 4 [95%CI(0.003 6,0.005 2)],Harrell's C指数和时间依赖性ROC曲线下面积分别为0.703 [95%CI(0.614,0.781)和0.694 [95%CI(0.636,0.751)]。模型在180 d时的校准度良好,见图2,在开发队列和验证队列中,预测概率与实际概率均具有较高的一致性。

进一步分析模型在不同亚组人群中的表现,结果显示模型在各种他汀类药物用药类型和不同单次用药剂量的亚组中均具有良好的整体表现和区分度,见表2。特别是在脂水双溶型和单次剂量≤10 mg的亚组中,模型的表现尤为突出。此外,该模型在首次用药后1个月到1年的随访时间内表现出良好的区分度(Harrell's C指数>0.7),见表3。校准曲线图也表明,模型在首次用药后30 d、90 d、180 d,预测概率和实际概率具有良好的一致性,见图3。

  • 表格2 首次用药后180 d时模型在不同用药特征亚组中的表现
    Table 2.Performance of the model across different medication characteristic subgroups at 180 days after initial statin use

  • 表格3 首次用药后180 d内不同时间点的模型表现
    Table 3.Model performance at different time points within 180 days after initial statin use
    注:AUC. 曲线下面积(area under curve )。

  • 图3 不同时间点的校准曲线图
    Figure 3.Calibration plots at different time points
    注:A. 30 d时点校准曲线图;B. 90 d时点校准曲线图;C. 180 d时点校准曲线图。

3 讨论

本研究利用鄞州区区域健康信息平台,基于XGBoost算法针对首次他汀类药物用药人群开发了用药后180 d内发生ALI不良反应的预测模型,并通过时序验证评估了其性能。该模型整合了6个维度的16个预测变量,这些变量涵盖人口学特征、生活方式、家族史、既往史、他汀类药物用药情况以及合并用药情况,均为临床中常规收集或容易获取的指标,确保了模型在实际应用中的可行性和便捷性。模型在区分度和校准度方面表现良好,显示出较强的预测能力和稳定性,能够为临床医生提供可靠的个体化风险评估工具。

预测因子方面,合并用药类数和既往用药类数是模型中最主要的预测变量,与现有文献[34]中的发现一致,表明复杂用药情况可能增加他汀类药物引起的ALI风险。此外,患者的锻炼强度、饮酒习惯和CCI得分也对模型的预测效能贡献显著,说明生活方式和患者的整体健康状况都是评估ALI风险的重要因素。医生应鼓励他汀类药物用药者戒酒并加强运动,以降低ALI的风险[35]。通过改善生活方式,患者的整体健康状况也能得到提升,从而减少其他潜在并发症的发生。大剂量他汀类药物可能增加ALI的风险,医生在开具处方时应谨慎评估患者的初始用药剂量,必要时可逐步调整剂量,以确保疗效的同时最大限度地减少ALI发生[36]。脂水双溶型他汀类药物,如阿托伐他汀,更易导致ALI,这一发现与既往文献[37]相吻合。临床医生应特别关注使用阿托伐他汀的患者,定期监测其肝功能,发现异常时及时调整治疗方案[37-38]。基因、表型等维度的预测变量在预测药物性肝损伤方面具有更高的敏感性和特异性,但其检测成本较高,考虑到本研究的目标是开发一个简便、经济且易于临床应用的模型,因此未纳入上述指标[39-41]。

考虑到ALI在他汀类药物用药者中的罕见性,本研究采用XGBoost算法结合代价敏感学习的方法,通过增加出现ALI的用药者样本的权重,提高了模型对ALI的分类性能。进一步地,以XGBoost输出的风险评分为预测变量构建Cox模型,为他汀类药物用药者在180 d内发生ALI的个体化绝对风险提供了预测,有助于医生进行患者精准分层,从而提高预防和管理的针对性。亚组分析和敏感性分析结果表明,该模型在不同用药情况和用药后不同时间段内均表现出良好的预测效果,尤其是在临床较为常见用药场景,即脂水双溶型他汀类药物和单次剂量小于10 mg的亚组中[42],模型的性能尤为突出,显示出较大的应用价值。因此,推荐临床医生在开具他汀类药物处方时首先使用该模型对患者的ALI风险进行预测,并对高风险患者进行重点关注,增加肝功能监测频率,以便早期发现问题并及时调整治疗方案,最大限度地减少ALI的发生。

本研究具有以下优势:①开发了首个专门针对ALI的预测模型,基于首次他汀类药物用药者的数据,为医生提供了一个有效的工具来评估患者发生ALI的风险;②通过使用XGBoost算法结合代价敏感学习方法,模型有效处理了ALI发生率低导致的类不平衡问题,提高了阳性结局的预测效果;③该模型整合了多个维度的临床变量,包括人口学特征、生活方式、既往史和用药情况等,均为临床上易于获得的数据,能够帮助医生实现个体化风险评估,精准识别高风险患者并进行有效管理。

本研究也存在一些局限性:①ALI结局的定义主要依赖于生化指标,未进行病例验证,但这部分影响有限,因为ALI定义综合了多项基于真实世界数据开展的药物肝毒性研究,具有较高的准确性,而同类研究中进行病例验证的情况也较少[43];②模型的预测变量均为基线时的固定变量,未考虑患者在用药状态的动态变化,这可能限制模型的预测能力;③尽管本研究进行了时序验证,但验证队列与开发队列仍来自同一人群,因此结果的外推性受到一定限制,未来研究中应使用多中心数据进行地域外部验证[44]。

综上,本研究开发并验证了一个基于XGBoost的他汀类药物用药者发生ALI的预测模型。该模型在不同用药情形的患者中均表现出良好的区分度和校准度,为临床医生提供了可靠的个体化评估工具,有助于实现风险分层,优化治疗方案,从而减少ALI的发生。

利益冲突声明:作者声明本研究不存在任何经济或非经济利益冲突。

参考文献| References

1.Kim DS, Scherer PE. Obesity, diabetes, and increased cancer progression[J]. Diabetes Metab J, 2021, 45(6): 799-812. DOI: 10.4093/dmj.2021.0077.

2.中国血脂管理指南修订联合专家委员会. 中国血脂管理指南(基层版2024年)[J]. 中华心血管病杂志, 2024, 52(4): 330-337. [Joint Committee on the Chinese Guidelines for Lipid Management. Chinese guideline for lipid management (primary care version 2024)[J]. Chinese Journal of Cardiology, 2024, 52(4): 330-337.] DOI: 10.3760/cma.j.cn112148-20240102-00002.

3.Newman CB, Preiss D, Tobert JA, et al. Statin safety and associated adverse events: a scientific statement from the American Heart Association[J]. Arterioscler Thromb Vasc Biol, 2019, 39(2): e38-e81. DOI: 10.1161/atv.0000000000000073.

4.韦诗友, 郑莉. 他汀类药物在老年患者临床应用安全性的评价进展[J]. 华西医学, 2017, 32(2): 290-297. DOI: 10.7507/1002-0179.201507088.

5.Björnsson E, Jacobsen EI, Kalaitzakis E. Hepatotoxicity associated with statins: reports of idiosyncratic liver injury post-marketing[J]. J Hepatol, 2012, 56(2): 374-380. DOI: 10.1016/j.jhep.2011.07.023.

6.Law M, Rudnicka AR. Statin safety: a systematic review[J]. Am J Cardiol, 2006, 97(8a): 52c-60c. DOI: 10.1016/j.amjcard. 2005.12.010.

7.孔飞飞, 谭兴起, 郭良君. 阿托伐他汀钙致肝功能异常[J]. 药物流行病学杂志, 2011, 20(5): 267-267. DOI: 10.19960/j.cnki.issn1005-0698.2011.05.022.

8.他汀类药物安全性评价工作组. 他汀类药物安全性评价专家共识[J]. 中华心血管病杂志, 2014, 42(11): 890-894. [Working Group of the Evaluation on the Safety of Statins. Experts consensus of the evaluation on the statin drugs safty[J]. Chinese Journal of Cardiology, 2014, 42(11): 890-894.] DOI: 10.3760/cma.j.issn.0253-3758.2014.11.002.

9.Wang B, Huang S, Li S, et al. Hepatotoxicity of statins: a real-world study based on the US Food and Drug Administration Adverse Event Reporting System database[J]. Front Pharmacol, 2024, 15: 1502791. DOI: 10.3389/fphar.2024.1502791.

10.Horodinschi RN, Stanescu AMA, Bratu OG, et al. Treatment with statins in elderly patients[J]. Medicina (Kaunas), 2019, 55(11): 721. DOI: 10.3390/medicina55110721.

11.Björnsson ES. Hepatotoxicity of statins and other lipid-lowering agents[J]. Liver Int, 2017, 37(2): 173-178. DOI: 10.1111/liv. 13308.

12.Allen RM, Marquart TJ, Albert CJ, et al. miR-33 controls the expression of biliary transporters, and mediates statin- and diet-induced hepatotoxicity[J]. EMBO Mol Med, 2012, 4(9): 882-895.DOI: 10.1002/emmm.201201228.

13.Cooper-DeHoff RM, Niemi M, Ramsey LB, et al. The clinical pharmacogenetics implementation consortium guideline for SLCO1B1, ABCG2, and CYP2C9 genotypes and statin-associated musculoskeletal symptoms[J]. Clin Pharmacol Ther, 2022, 111(5): 1007-1021. DOI: 10.1002/cpt.2557.

14.Xiong Y, Liu X, Wang Q, et al. Machine learning-based prediction model for the efficacy and safety of statins[J]. Front Pharmacol, 2024, 15: 1334929. DOI: 10.3389/fphar.2024.1334929.

15.Lin H, Tang X, Shen P, et al. Using big data to improve cardiovascular care and outcomes in China: a protocol for the Chinese Electronic Health Records Research in Yinzhou (CHERRY) Study[J]. BMJ Open, 2018, 8(2): e019698. DOI: 10.1136/bmjopen-2017-019698.

16.赵厚宇, 柴三葆, 孙烨祥, 等. 二甲双胍与2型糖尿病患者痴呆症发病风险相关性的回顾性队列研究[J]. 中国糖尿病杂志, 2024, 32(8): 567-575. [Zhao HY, Chai SB, Sun YX, et al. Retrospective cohort study on the relationship between metformin and the risk of dementia in patients with type 2 diabetes mellitus[J]. Chinese Journal of Diabetes, 2024, 32(8): 567-575.] DOI: 10.3969/j.issn.1006-6187.2024.08.002.

17.Lund JL, Richardson DB, Stürmer T. The active comparator, new user study design in pharmacoepidemiology: historical foundations and contemporary application[J]. Curr Epidemiol Rep, 2015, 2(4): 221-228. DOI: 10.1007/s40471-015-0053-5.

18.De Vriese AS. Should statins be banned from dialysis?[J]. J Am Soc Nephrol, 2017, 28(6): 1675-1676. DOI: 10.1681/asn. 2017020201.

19.Danan G, Teschke R. Roussel uclaf causality assessment method for drug-induced liver injury: present and future[J]. Front Pharmacol, 2019, 10: 853. DOI: 10.3389/fphar.2019.00853.

20.中国医药生物技术协会药物性肝损伤防治技术专业委员会, 中华医学会肝病学分会药物性肝病学组. 中国药物性肝损伤诊治指南(2023年版)[J]. 中华肝脏病杂志, 2023, 31(4): 355-384. [Technology Committee on DILI Prevention and Management, Chinese Medical Biotechnology Association; Study Group of Drug-Induced Liver Disease, Chinese Medical Association for the Study of Liver Diseases. Chinese guideline for diagnosis and management of drug-induced liver injury (2023 version)[J]. Chinese Journal of Hepatology, 2023, 31(4): 355-384.] DOI: 10.3760/cma.j.cn501113-20230419-00176-1.

21.García-Rodríguez LA, González-Pérez A, Stang MR, et al. The safety of rosuvastatin in comparison with other statins in over 25,000 statin users in the Saskatchewan Health Databases[J]. Pharmacoepidemiol Drug Saf, 2008, 17(10): 953-961. DOI: 10.1002/pds.1602.

22.Douglas IJ, Langham J, Bhaskaran K, et al. Orlistat and the risk of acute liver injury: self controlled case series study in UK Clinical Practice Research Datalink[J]. BMJ, 2013, 346: f1936. DOI: 10.1136/bmj.f1936.

23.Falconer N, Nand S, Liow D, et al. Development of an electronic patient prioritization tool for clinical pharmacist interventions[J]. Am J Health Syst Pharm, 2014, 71(4): 311-320. DOI: 10.2146/ajhp130247.

24.Alfirevic A, Neely D, Armitage J, et al. Phenotype standardization for statin-induced myotoxicity[J]. Clin Pharmacol Ther, 2014, 96(4): 470-476. DOI: 10.1038/clpt.2014.121.

25.White IR, Royston P, Wood AM. Multiple imputation using chained equations: Issues and guidance for practice[J]. Stat Med, 2011, 30(4): 377-399. DOI: 10.1002/sim.4067.

26.Heidarian Miri H, Hassanzadeh J, Rajaeefard A, et al. Multiple imputation to correct for nonresponse bias: application in non-communicable disease risk factors survey[J]. Glob J Health Sci, 2015, 8(1): 133-142. DOI: 10.5539/gjhs.v8n1p133.

27.Mao B, Ma J, Duan S, et al. Preoperative classification of primary and metastatic liver cancer via machine learning-based ultrasound radiomics[J]. Eur Radiol, 2021, 31(7): 4576-4586. DOI: 10.1007/s00330-020-07562-6.

28.Bradic J, Fan J, Jiang J. Regularization for Cox's proportional hazards model with NP-dimensionality[J]. Ann Stat, 2011, 39(6): 3092-3120. DOI: 10.1214/11-aos911.

29.Friedman JH. Stochastic gradient boosting[J]. Comput Stat Data An, 2002, 38(4): 367-378. DOI: 10.1016/S0167-9473(01)00065-2.

30.Aldraimli M, Soria D, Grishchuck D, et al. A data science approach for early-stage prediction of patient's susceptibility to acute side effects of advanced radiotherapy[J]. Comput Biol Med, 2021, 135: 104624. DOI: 10.1016/j.compbiomed.2021.104624.

31.Pan Z, Zhang R, Shen S, et al. OWL: an optimized and independently validated machine learning prediction model for lung cancer screening based on the UK Biobank, PLCO, and NLST populations[J]. EBioMedicine, 2023, 88: 104443. DOI: 10.1016/j.ebiom.2023.104443.

32.Hosmer DW Jr LS, Sturdivant RX, eds. Applied logistic regression[M]. Hoboken: John Wiley & Sons, Inc., 2013: 117.

33.Collins GS, Reitsma JB, Altman DG, et al. Transparent reporting of a multivariable prediction model for individual prognosis or diagnosis (TRIPOD): the TRIPOD statement[J]. BMJ, 2015, 350: g7594. DOI: 10.1136/bmj.g7594.

34.郭恒, 李丹丹, 温爱萍, 等. 9城市老年患者使用他汀类药物潜在药物相互作用分析[J]. 中南药学, 2023, 21(5): 1377-1382. [Guo H, Li DD, Wen AP, et al. Potential drug-drug interactions with statins among elderly patients in 9 cities in China[J]. Central South Pharmacy, 2023, 21(5): 1377-1382.] DOI: 10.7539/j.issn.1672-2981.2023.05.042.

35.Bytyçi I, Penson PE, Mikhailidis DP, et al. Prevalence of statin intolerance: a Meta-analysis[J]. Eur Heart J, 2022, 43(34): 3213-3223. DOI: 10.1093/eurheartj/ehac015.

36.Escobar C, Echarri R, Barrios V. Relative safety profiles of high dose statin regimens[J]. Vasc Health Risk Manag, 2008, 4(3): 525-533. DOI: 10.2147/vhrm.s2048.

37.国家药品不良反应监测中心. 国家药品不良反应监测年度报告(2022年)[J]. 中国病毒病杂志, 2023, 13(4): 245-251. [Chinese national center for adverse drug reaction monitoring. Annual report of national adverse drug reaction monitoring (2022) [J]. Chinese Journal of Viral Diseases, 2023, 13(4): 245-251.] DOI: 10.16505/j.2095-0136.2023.4003.

38.Cai T, Abel L, Langford O, et al. Associations between statins and adverse events in primary prevention of cardiovascular disease: systematic review with pairwise, network, and dose-response Meta-analyses[J]. BMJ, 2021, 374: n1537. DOI: 10.1136/bmj.n1537.

39.Kaniwa N, Saito Y. Pharmacogenomics of severe cutaneous adverse reactions and drug-induced liver injury[J]. J Hum Genet, 2013, 58(6): 317-326. DOI: 10.1038/jhg.2013.37.

40.Wang CW, Preclaro IAC, Lin WH, et al. An updated review of genetic associations with severe adverse drug reactions: translation and implementation of pharmacogenomic testing in clinical practice[J]. Front Pharmacol, 2022, 13: 886377. DOI: 10.3389/fphar.2022.886377.

41.Floyd JS, Bloch KM, Brody JA, et al. Pharmacogenomics of statin-related myopathy: Meta-analysis of rare variants from whole-exome sequencing[J]. PLoS One, 2019, 14(6): e0218115. DOI: 10.1371/journal.pone.0218115.

42.江林双, 陈茂伟. 阿托伐他汀药物性肝损伤的临床特征分析[J]. 中国全科医学, 2024, 27(30): 3772-3775, 3783. [Jiang LS, Chen MW. Clinical characteristics of liver injury induced by atorvastatin[J]. Chinese General Practice, 2024, 27(30): 3772-3775, 3783.] DOI: 10.12114/j.issn.1007-9572.2023.0698.

43.邰隽, 于淼, 张琳, 等. 基于自然语言处理技术的儿童病例注射用尖吻蝮蛇血凝酶不良反应主动监测方法构建与验证研究[J]. 中国药物警戒, 2023, 20(9): 1011-1016. [Tai J, Yu M, Zhang L. Active monitoring of adverse reactions related to haemocoagulase agkistrodon for injection in children[J]. Chinese Journal of Pharmacovigilance, 20(9): 1011-1016.] DOI: 10.19803/j.1672-8629.20220736.

44.Moons KG, Kengne AP, Grobbee DE, et al. Risk prediction models: II. External validation, model updating, and impact assessment[J]. Heart, 2012, 98(9): 691-698. DOI: 10.1136/heartjnl-2011-301247.