目的 构建并验证皮肤型红斑狼疮(CLE)(包含未明确分型的患者)及其2种亚型[盘状红斑狼疮(DLE)和亚急性皮肤型红斑狼疮(SCLE)]的数据提取与患者识别规则,以实现从医疗保险数据库中高效识别CLE患者。
方法 利用2013—2017年全国医疗保险数据库,构建数据提取与患者识别规则,并以人工核查结果为金标准,计算规则的灵敏度和特异度,同时对识别出的患者进行基本特征分析。
结果 基于标准医学术语及诊断编码构建标准表达式,并结合临床医师的经验,补充可能的别称、错写等情况,以完善初筛表达式。在此基础上,由临床医师与数据管理工程师通过反复核查,最终确定疾病精筛规则。构建的3种目标疾病的数据提取与患者快速识别规则均表现良好,CLE、DLE和SCLE的灵敏度分别为0.985、1.000和0.991,特异度分别为0.997、0.999和0.998。共提取2013—2017年CLE患者34 554例,其中DLE患者2 879例,SCLE患者623例,女性比例均高于男性。
结论 构建的CLE数据提取与患者识别规则具备良好的性能,为皮肤病学研究中患者快速识别方法的开发与优化提供了参考。
红斑狼疮(lupus erythematosus,LE)是一种慢性、反复发作的自身免疫性疾病,临床表现复杂多样。该病为一种病谱性疾病,其一端是主要累及皮肤黏膜的皮肤型红斑狼疮(cutaneous lupus erythematosus,CLE),另一端为累及多脏器、多系统的系统性红斑狼疮(systemic lupus erythematosus,SLE)[1]。CLE与SLE之间并无明确界限。研究[2]显示,超过75%的SLE患者会出现皮肤受累,其中部分以皮肤症状为首发症状。此外,部分CLE患者在病程中可能进展为SLE,成人和儿童患者的进展比例分别为0%~42%和0%~31%。急性皮肤型红斑狼疮(acute cutaneous lupus erythematosus,ACLE)被认为是SLE的最典型的皮肤表现之一[3-5]。
根据临床表现和组织病理学特征,CLE主要分为ACLE、亚急性皮肤型红斑狼疮(subacute cutaneous lupus erythematosus,SCLE)以及慢性皮肤型红斑狼疮(chronic cutaneous lupus erythematosus,CCLE)[6]。其中,ACLE可进一步分为局限型和泛发型;SCLE可分为环状红斑型和丘疹鳞屑型;CCLE则涵盖多种亚型,最常见的是盘状红斑狼疮(discoid lupus erythematosus,DLE),可分为局限性和播散性。此外,CCLE还包括:疣状LE、肿胀性LE、深在性LE/狼疮性脂膜炎、冻疮样LE、Blaschko线状LE[1]。在所有CLE亚型中,DLE和SCLE最为多见,分别占CLE总病例的50%~85%和7%~27%[7]。由于病程长,且直接影响患者外貌,部分亚型还会遗留瘢痕、脂肪萎缩等损容性后遗症,CLE不仅严重影响患者生活质量,还会带来沉重的经济负担[8]。因此,了解CLE及其常见亚型的流行病学特征,对于全面掌握疾病现状、实现疾病及时诊断和治疗具有重要意义[9]。然而,目前我国尚缺乏针对CLE及其常见亚型的大规模基于人群的流行病学特征研究。
医疗保险数据是在医疗保险业务过程中产生的数据,具有数据量庞大、覆盖范围广的特点,可较为完整地记录特定时间内人群的就诊信息和报销情况,为患者治疗模式、医疗资源使用及成本探索提供真实世界证据[10]。但既往研究发现,医疗保险数据主要用于医疗报销,并非专为研究而设,简单使用疾病编码可能无法直接获取研究所需的病例。因此,在利用这些数据开展流行病学研究(如疾病负担估算)或临床研究时,需根据研究目标制定合适的疾病定义[11]。基于此,本研究利用2013—2017年全国医疗保险数据库,构建适用于CLE及其2种常见亚型(DLE和SCLE)的数据提取与患者识别规则,以期为基于健康医疗大数据估算疾病负担的研究提供参考。
1 资料与方法
1.1 数据来源
研究数据来源于2013—2017年全国医疗保险流行病学研究数据库,该数据涵盖了城镇职工基本医疗保险(urban employee basic medical insurance,UEBMI)和城镇居民基本医疗保险(urban resident basic medical insurance,URBMI)数据[12-13],截至2016年已覆盖中国超过95%的城镇人口[14-15]。其中,UEBMI数据主要覆盖城市地区在职和退休员工,包括政府机构、事业单位、国有企业、私营企业、社会组织和其他私营实体的雇主和雇员;URBMI数据涵盖城市地区中未参加职工医疗保险的居民,即儿童、学生、老年人和失业居民。研究纳入的变量包括年龄、性别、就诊年份、医疗保险类型。所有数据对个人信息均进行匿名化处理。本研究经北京大学生物伦理委员会审批通过(批件号:IRB00001052-24068),并豁免知情同意。
1.2 数据提取和患者识别规则的构建
研究数据提取的主要框架与既往研究一致[13],具体为:首先,筛选包含“狼疮”或“LE”的诊断以及国际疾病分类第九版(International Classification of Diseases-9,ICD-9)与第十版(ICD-10)编码,构建LE数据库(表1),具体检索式可见ResearchGate DOI: 10.13140/RG.2.2. 23330.34242。在LE数据库基础上,利用表达式进一步提取CLE数据库。CLE的病例定义为患者在医疗保险数据库中曾被诊断为任一CLE亚型(如DLE、SCLE、ACLE等)或有CLE相关诊断但亚型分型尚不明确,如曾被诊断为红斑狼疮(L93.001)、局限性红斑狼疮(其他的)(L93.200),无论其是否合并存在SLE诊断记录[16]。疾病表达式主要分为两类:标准诊断表达式(set①)和其他相关表达式(set②)。其中,标准诊断表达式为基于ICD-9、ICD-10编码以及国家卫生健康委员会于2016年发布的国家标准《GB/T 14396-2016 疾病分类与代码》中的中文医学术语[17]。此外,在真实临床环境中,缩写、别名及拼写错误较为常见,使得疾病表述可能有所变化[13]。因此,本研究进一步构建了可能与疾病相关的其他相关表达式,以最大程度涵盖临床记录中的多样性。该部分由皮肤科专科医师依据临床经验独立制定,尽可能列举了各种缩写、别名及潜在拼写错误,以提高筛选的全面性和准确性。简而言之,其他相关表达式不仅涵盖了CLE,还可能涉及其他具有狼疮样表现的疾病。相较于标准诊断表达式,这一表达式组合能更广泛地捕捉潜在CLE病例,但其筛选结果可能会遗漏部分CLE病例或将部分非CLE病例误归类在其中,仍需进一步判定。
在LE数据库提取到的78 585条诊断文本中,5 614条诊断文本包含CLE标准诊断的术语或编码。针对剩余诊断文本,由临床医师依据纳入与排除标准进行人工核查,并提取符合要求的诊断文本及其对应编码。具体纳入标准:①LE及其各亚型(包括各型CLE和SLE)的标准诊断及ICD-10、ICD-9编码;②LE及其各亚型相关诊断别称、可能的错误拼写名称;③符合LE及其各亚型特异性相关临床表现描述(如蝶形红斑、盘状红斑)[1, 18]。排除标准:①诊断文本无法证明为诊断明确的LE/CLE/DLE/SCLE;②疾病名称中含有相关筛选字符,但明确不是目标疾病患者,如“寻常狼疮”(为皮肤结核的一种);③ 因检索词局限型带来的错误筛选患者,如因“LE”检索词带来的“利普刀(LEEP)术后”患者;④疾病待查、疑诊(例如诊断中包含“?”等符号)或不确定诊断(LE集合为总集未排除,CLE/DLE/SCLE筛选集均有排除)。随后,与数据工程师进行反复核对,排除所有待查或不确定诊断,直至所有诊断文本均符合疾病诊断标准,最终确定用于进一步筛选的其他表达式(set③)。该表达式(set③)与前述标准诊断表达式(set①)合并,共同构成最终的精准筛选表达式。为验证所构建的数据提取表达式的有效性和准确性,进一步对原始数据库中的每条诊断文本进行人工判定(其中,CLE以LE数据库为基础筛选,DLE和SCLE以CLE数据库为基础筛选),判断其是否属于目标疾病。最终,以人工核查结果作为“金标准”,计算表达式的灵敏度和特异度[13, 19]。根据前期研究[14],仅保留数据质量较高的23个省份的数据。完整流程见图1。在通过表达式提取所有符合标准的诊断记录后,使用患者唯一标识符对不同年份信息进行整合与去重,仅保留首次确诊的CLE亚型诊断记录[20],用于后续的发病特征分析。在对抓取的CLE患者及诊断为DLE与SCLE 2种亚型患者的基本特征进行描述中,计量资料以表示,计数资料以n (%)表示。
2 结果
最终确定的数据提取与患者识别规则涵盖以下3个方面:①标准诊断名称及其对应的ICD编码(包括ICD-9和ICD-10);②疾病的别称或可能存在的拼写错误(包括中文、英文以及中英文混写形式);③与诊断相关的临床表现描述。在CLE中,标准诊断名称包括红斑狼疮、盘状红斑狼疮、局限性红斑狼疮(其他的)、亚急性皮肤红斑狼疮、急性皮肤红斑狼疮、肿胀性(瘤样)狼疮、狼疮性脂膜炎、深在性红斑狼疮;相应ICD编码为ICD-10的L93和ICD-9的695.4。在别称及拼写错误方面,除了常见英文缩写外,还包括银屑病狼疮、间歇狼疮、冻疮狼疮、疣样(状)LE、肥厚狼疮、线样(状)狼疮、大疱狼疮、水疱狼疮等拼写不规范情况;在诊断相关临床表现描述中包含了环形(状)红斑狼疮、丘疹鳞屑狼疮、蝶形(状)红斑及“红蝴蝶”等描述词。最后,为保证数据准确性,进一步排除疑似或待查诊断条目,避免因诊断不明影响结果准确性。
在CLE数据库中,进一步提取DLE以及SCLE相关诊断,包括标准诊断名称、对应ICD编码以及别称或可能的错误拼写。具体而言,在DLE中,标准诊断为盘状红斑狼疮;ICD编码包括L93.0(ICD-10)以及695.402(ICD-9);别称以及可能的错误拼写为DLE。在SCLE中,标准诊断为亚急性皮肤红斑狼疮;ICD编码为L93.1(ICD-10);别称以及拼写错误包括SCLE、环状(形)红斑以及丘疹鳞屑(表2)。基于最终确定的诊断文本,提取关键诊断特征,用于构建系统性的数据提取与患者识别规则检索策略以人工判定结果被作为金标准,CLE、DLE以及SCLE三种目标疾病的数据提取和患者识别规则表现均良好,灵敏度分别为0.985、1.000以及0.991,特异度分别为0.997、0.999以及0.998。
在医疗保险数据库中共提取2013—2017年CLE患者34 554例,平均年龄为(44.21±15.05)岁,女性26 904例(77.86%)。DLE患者和SCLE患者分别有2 879例以及623例,诊断时的平均年龄分别为(48.10±15.32)岁和(42.96±15.74)岁,女性占比均高于男性(表3)。
3 讨论
本研究利用覆盖近3亿人的全国医疗保险数据,构建并验证了一种适用于CLE及其2种亚型(DLE和SCLE)的数据提取与患者识别规则,用于识别CLE、DLE以及SCLE患者。最终规则的表现较好,可以较准确地从医疗保险数据库中识别CLE及其亚型病例。本研究共抓取2013—2017年CLE患者34 554例,其中2 879例被诊断为DLE,623例诊断为SCLE,为进一步依托全国医疗保险数据测算CLE疾病负担及经济负担提供了数据支撑。作为一种慢性、反复迁延的自身免疫性疾病,CLE目前尚无任何获批的特异性治疗药物[21]。现有治疗策略主要包括非药物干预(如避免日晒等不良刺激、合理饮食等)、局部治疗(包括糖皮质激素、钙调神经磷酸酶抑制剂及维A酸类制剂)以及系统治疗(如抗疟疾药物)[1]。近年来,针对CLE的靶向治疗研发取得进展,包括抑制I型干扰素通路的anifrolumab[22]、抑制血液树突状细胞抗原2的litifilimab(BIIB059)[21-23]等新型药物正处于临床试验阶段。了解真实世界中CLE患者的总体数量及其流行特征,不仅有助于辅助靶点筛选和优化临床试验设计,也为后续疗效与安全性评估提供重要的数据基础[24-25]。随着数智化技术的快速发展及电子健康数据的广泛应用,自动化病例识别与数据提取已成为真实世界数据研究的热点方向[19, 26-27]。既往有研究[28]总结了构建基于电子健康数据库的病例识别所需要的数据要素,其中使用诊断编码是识别病例最常用与最简单的方法。然而,利用诊断编码识别患者的准确性、有效性与疾病类型以及医生诊断编码的质量密切相关。例如,对于某些疾病(如癌症、糖尿病等),诊断编码的灵敏度和特异度较高,但其他疾病(如心力衰竭)诊断编码的灵敏度和特异度较低[28-29]。因此,目前的研究尝试整合多种数据要素,以提高病例识别的准确性。
在LE疾病领域,现有的快速患者识别规则/算法主要聚焦于SLE。国内已有研究者同样基于全国医疗保险数据库构建SLE患者的识别规则,其灵敏度和特异度均超过94%,展现出较高的准确性和可靠性[13]。此外,Barnado等[30]基于电子健康记录(electronic health records,EHR)构建了首个识别SLE的方法,该方法整合了ICD-9编码、实验室指标以及用药记录等多维度临床数据进行患者识别,在训练集和验证集中阳性预测值分别可达到95%和91%。Swerdel等[31]则基于医疗保险数据和EHR数据,开发了4种用于评估SLE现患率和新发病例的算法。此外,一些研究者尝试依托医疗保险数据或者医疗保险数据与电子病历数据的整合数据库构建识别SLE复发患者的算法[32-33]。除了上述提到的SLE相关研究外,Tang等[34]在开发识别哮喘病例的方法时提出,除了就诊记录的诊断外,还可将问题列表(problem list)纳入其中,以捕捉有哮喘记录但是无哮喘就诊诊断的病情较轻的患者,从而更全面地识别目标人群并提高可计算表型的准确性。此外,为进一步优化数据利用,有研究者将通用数据模型与病例识别算法整合,对数据预先进行标准化处理。这种做法不仅提高了数据利用率和识别率,还为向采用不同编码系统的数据库扩展保留了潜力[26, 35]。
然而,目前尚缺乏针对CLE及其常见亚型的快速识别患者的规则/算法的构建,可能与CLE皮损异质性较大,导致其准确诊断及分型诊断至今仍是临床工作面临的主要挑战有关[4]。在已发表的CLE疾病负担研究中,仅有一项韩国研究以全国医疗保险数据为资源来源,该研究使用ICD-10编码(L93)进行患者识别与病例确定[36]。然而,一项针对基于医疗保险数据识别SLE患者的规则/算法有效性的系统综述[37]指出,仅依赖ICD编码识别患者的方法,在筛选特定人群(如风湿科门诊就诊者)的医疗保险数据时,阳性预测值可达70%~90%,但在一般人群中仅为50%~60%。因此,除了标准诊断和疾病编码之外,结合更多的信息,例如更多样的诊断文本表达,可能有助于更全面地识别目标疾病患者并提高识别准确性。以目前CLE及其2种亚型(DLE与SCLE)规则识别出的患者数作为分子,以每年各省各性别年龄亚组城镇职工和城镇居民中参保者对应的总人年作为分母,设置4年的洗脱期,估算2017年全国CLE发病粗率为9.74/10万人年,DLE和SCLE的发病率分别为0.37/10万人年和0.14/10万人年,略高于既往已发表基于人群的CLE流行病学研究,可能与现阶段构建的计算表型尚未排除可能合并SLE的患者有关,但患者特征与既往研究[36, 38-39]类似。
目前的CLE数据提取与患者识别规则仍存在一定局限,尚有进一步优化的空间。首先,现行疾病分类体系(如ICD编码)无法完全对应CLE各亚型,这为开发适用于不同CLE亚型的患者识别规则带来挑战。已有流行病学研究采用单纯性CLE(isolated CLE)的定义,即仅纳入具有狼疮特异性皮肤损害但不满足SLE分类标准的患者[40-41],进一步聚焦CLE本身的疾病特征,避免SLE对疾病负担估计可能的影响。因此,后续研究有必要进一步细化CLE的定义,并基于不同亚群评估其疾病负担。其次,本研究中排除了所有待诊待查及疑似诊断的记录。尽管该策略可提升诊断的确定性,但后续研究中可将此类患者纳入分析,并开展敏感性分析以验证识别规则的稳健性[13]。在外推性方面,当前构建的患者识别规则主要依赖于医疗保险数据库中疾病编码和诊断文本,由于数据覆盖范围广,数据体量大,在国内其他医疗保险数据库具有推广潜力。既往研究[42-43]表明,医疗保险数据与EHR数据在疾病诊断方面具有一定的一致性,然而,不同数据源在诊断记录的完整性和准确性方面仍存在差异[44],未来可尝试整合EHR等多源数据,提升患者识别策略的精度与适用性,实现信息最大化利用[13]。此外,结合机器学习、大语言模型等方法亦可进一步拓展患者识别规则的覆盖范围并优化其识别效果,未来研究可考虑进一步整合上述技术对现有规则进行优化[28, 45]。尽管存在上述挑战,本研究基于全国医疗保险数据库,融合标准化的疾病定义与专科医师临床经验,初步建立了可快速识别CLE及其常见亚型(DLE与SCLE)患者的识别规则,为后续相关研究的开展与优化提供了实证基础与方法参考。
利益冲突声明:作者声明本研究不存在任何经济或非经济利益冲突。
志谢:本研究得到默克雪兰诺(北京)医药研发有限公司的资助,但研究由通信作者发起,默克雪兰诺(北京)医药研发有限公司在研究设计、数据收集与分析、发表决策或论文撰写过程中均未参与。
1.中华医学会皮肤性病学分会红斑狼疮研究中心. 皮肤型红斑狼疮诊疗指南(2019版)[J]. 中华皮肤科杂志, 2019, 52(3): 149-155. [Centre for Lupus Erythematosus Research, Chinese Society of Dermatology. Guideline for diagnosis and treatment of cutaneous lupus erythematosus(2019)[J]. Chinese Journal of Dermatology, 2019, 52(3): 149-155.] DOI: 10.3760/cma.j.issn.0412-4030.2019.03.001.
2.Stull C, Sprow G, Werth VP. Cutaneous involvement in systemic lupus erythematosus: a review for the rheumatologist[J]. J Rheumatol, 2023, 50(1): 27-35. DOI: 10.3899/jrheum.220089.
3.Curtiss P, Walker AM, Chong BF. A systematic review of the progression of cutaneous lupus to systemic lupus erythematosus[J]. Front Immunol, 2022, 13: 866319. DOI: 10.3389/fimmu.2022. 866319.
4.Lu Q, Long H, Chow S, et al. Guideline for the diagnosis, treatment and long-term management of cutaneous lupus erythematosus[J]. J Autoimmun, 2021, 123: 102707. DOI: 10.1016/j.jaut.2021. 102707.
5.Gronhagen CM, Fored CM, Granath F, et al. Cutaneous lupus erythematosus and the association with systemic lupus erythematosus: a population-based cohort of 1088 patients in Sweden[J]. Br J Dermatol, 2011, 164(6): 1335-1341. DOI: 10.1111/j.1365-2133.2011.10272.x.
6.Gilliam JN, Sontheimer RD. Distinctive cutaneous subsets in the spectrum of lupus erythematosus[J]. J Am Acad Dermatol, 1981, 4(4): 471-475. DOI: 10.1016/s0190-9622(81)80261-7.
7.Chang YC, Werth VP. Update on epidemiology and clinical assessment tools of cutaneous lupus erythematosus and dermatomyositis[J]. Curr Dermatol Rep, 2013, 2(1): 48-57. DOI: 10.1007/s13671-012-0037-3.
8.Tebbe B, Orfanos CE. Epidemiology and socioeconomic impact of skin disease in lupus erythematosus[J]. Lupus, 1997, 6(2): 96-104. DOI: 10.1177/096120339700600204.
9.Fernández Ávila DG, Rivera Maldonado M, Charry Anzola LP. Epidemiology and demographics of cutaneous lupus erythematosus in Colombia between 2015 and 2019[J]. Reumatismo, 2023, 75(1): 23-27. DOI: 10.4081/reumatismo.2023.1568.
10.Mathai SC, Hemnes AR, Manaker S, et al. Identifying patients with pulmonary arterial hypertension using administrative claims algorithms[J]. Ann Am Thorac Soc, 2019, 16(7): 797-806. DOI: 10.1513/AnnalsATS.201810-672CME.
11.Park JS, Lee CH. Clinical study using healthcare claims database[J]. J Rheum Dis, 2021, 28(3): 119-125. DOI: 10.4078/jrd.2021.28.3.119.
12.Tian Y, Liu H, Si Y, et al. Association between temperature variability and daily hospital admissions for cause-specific cardiovascular disease in urban China: a national time-series study[J]. PLoS Med, 2019, 16(1): e1002738. DOI: 10.1371/journal.pmed.1002738.
13.Li M, Li C, Cao M, et al. Incidence and prevalence of systemic lupus erythematosus in urban China, 2013-2017: a nationwide population-based study[J]. Sci Bull (Beijing), 2024, 69(19): 3089-3097. DOI: 10.1016/j.scib.2024.04.075.
14.Zhang C, Feng J, Wang S, et al. Incidence of and trends in hip fracture among adults in urban China: a nationwide retrospective cohort study[J]. PLoS Med, 2020, 17(8): e1003180. DOI: 10.1371/journal.pmed.1003180.
15.Li Y, Malik V, Hu FB. Health insurance in China: after declining in the 1990s, coverage rates rebounded to near-universal levels by 2011[J]. Health Aff (Millwood), 2017, 36(8): 1452-1460. DOI: 10.1377/hlthaff.2016.1658.
16.Vale ECSD, Garcia LC. Cutaneous lupus erythematosus: a review of etiopathogenic, clinical, diagnostic and therapeutic aspects[J]. An Bras Dermatol, 2023, 98(3): 355-372. DOI: 10.1016/j.abd. 2022.09.005.
17.国家卫生健康委. 疾病分类与代码(GB/T 14396-2016)[S/OL]. (2016-10-13) [2025-05-29]. https://openstd.samr.gov.cn/bzgk/std/newGbInfo?hcno=8127A7785CA677952F9DA062463CBC41.
18.Worm M, Zidane M, Eisert L, et al. S2k guideline: diagnosis and management of cutaneous lupus erythematosus-Part 1: Classification, diagnosis, prevention, activity scores[J]. J Dtsch Dermatol Ges, 2021, 19(8): 1236-1247. DOI: 10.1111/ddg.14492.
19.Yan S, Melnick K, He X, et al. Developing a computable phenotype for glioblastoma[J]. Neuro Oncol, 2024, 26(6): 1163-1170. DOI: 10.1093/neuonc/noad249.
20.Tian H, Yang W, Hu Y, et al. Estimating cancer incidence based on claims data from medical insurance systems in two areas lacking cancer registries in China[J]. EClinicalMedicine, 2020, 20: 100312. DOI: 10.1016/j.eclinm.2020.100312.
21.Cho SK, Vazquez T, Werth VP. Litifilimab (BIIB059), a promising investigational drug for cutaneous lupus erythematosus[J]. Expert Opin Investig Drugs, 2023, 32(5): 345-353. DOI: 10.1080/13543784.2023.2212154.
22.Xie L, Lopes Almeida Gomes L, Stone CJ, et al. An update on clinical trials for cutaneous lupus erythematosus[J]. J Dermatol, 2024, 51(7): 885-894. DOI: 10.1111/1346-8138.17161.
23.Cho YM, Furie R. The development of litifilimab (BIIB 059) for cutaneous and systemic lupus erythematosus[J]. Immunotherapy, 2024, 16(1): 15-20. DOI: 10.2217/imt-2023-0086.
24.Sherman RE, Anderson SA, Dal Pan GJ, et al. Real-world evidence-What is it and what can it tell us?[J]. N Engl J Med, 2016, 375(23): 2293-2297. DOI: 10.1056/NEJMsb1609216.
25.Girman CJ, Ritchey ME, Lo Re V 3rd. Real-world data: assessing electronic health records and medical claims data to support regulatory decision-making for drug and biological products[J]. Pharmacoepidemiol Drug Saf, 2022, 31(7): 717-720. DOI: 10.1002/pds.5444.
26.Wang HY, Du J, Yang Y, et al. Rapid identification of chronic kidney disease in electronic health record database using computable phenotype combining a common data model[J]. Chin Med J (Engl), 2023, 136(7): 874-876. DOI: 10.1097/cm9.0000000000002168.
27.Dawwas GK, Weiss A, Constant BD, et al. Development and validation of claims-based definitions to identify incident and prevalent inflammatory bowel disease in administrative healthcare databases[J]. Inflamm Bowel Dis, 2023, 29(12): 1993-1996. DOI: 10.1093/ibd/izad053.
28.McBrien KA, Souri S, Symonds NE, et al. Identification of validated case definitions for medical conditions used in primary care electronic medical record databases: a systematic review[J]. J Am Med Inform Assoc, 2018, 25(11): 1567-1578. DOI: 10.1093/jamia/ocy094.
29.Hirsch AG, Scheck McAlearney A. Measuring diabetes care performance using electronic health record data: the impact of diabetes definitions on performance measure outcomes[J]. Am J Med Qual, 2014, 29(4): 292-299. DOI: 10.1177/1062860613500808.
30.Barnado A, Casey C, Carroll RJ, et al. Developing electronic health record algorithms that accurately identify patients with systemic lupus erythematosus[J]. Arthritis Care Res (Hoboken), 2017, 69(5): 687-693. DOI: 10.1002/acr.22989.
31.Swerdel JN, Ramcharran D, Hardin J. Using a data-driven approach for the development and evaluation of phenotype algorithms for systemic lupus erythematosus[J]. PLoS One, 2023, 18(2): e0281929. DOI: 10.1371/journal.pone.0281929.
32.Goetz I, Choong C, Winnie J, et al. Development of a claims-based flare algorithm for systemic lupus erythematosus[J]. Curr Med Res Opin, 2022, 38(9): 1641-1649. DOI: 10.1080/03007995. 2022.2101804.
33.Wu SS, Perry A, Zimmerman NM, et al. Predictors of flare-related inpatient or emergency department stay in systemic lupus erythematosus: a real-world analysis of Medicaid claims in the United States[J]. J Manag Care Spec Pharm, 2024, 30(1): 61-70. DOI: 10.18553/jmcp.2024.30.1.61.
34.Tang M, Goldstein BA, He J, et al. Performance of a computable phenotype for pediatric asthma using the problem list[J]. Ann Allergy Asthma Immunol, 2020, 125(5): 611-613. e1. DOI: 10.1016/j.anai.2020.07.009.
35.Graham J, Iverson A, Monteiro J, et al. Applying computable phenotypes within a common data model to identify heart failure patients for an implantable cardiac device registry[J]. Int J Cardiol Heart Vasc, 2022, 39: 100974. DOI: 10.1016/j.ijcha.2022.100974.
36.Baek YS, Park SH, Baek J, et al. Cutaneous lupus erythematosus and its association with systemic lupus erythematosus: a nationwide population-based cohort study in Korea[J]. J Dermatol, 2020, 47(2): 163-165. DOI: 10.1111/1346-8138.15162.
37.Moores KG, Sathe NA. A systematic review of validated methods for identifying systemic lupus erythematosus (SLE) using administrative or claims data[J]. Vaccine, 2013, 31 Suppl 10: K62-73. DOI: 10.1016/j.vaccine.2013.06.104.
38.Maillet M, Tounkara BS, Vagner D, et al. Epidemiology of isolated cutaneous lupus erythematosus in the multiethnic population of Reunion Island (France): a retrospective multicentric study[J]. J Rheumatol, 2025, 52(3): 251-256. DOI: 10.3899/jrheum.2024-0661.
39.Petersen MP, Möller S, Bygum A, et al. Epidemiology of cutaneous lupus erythematosus and the associated risk of systemic lupus erythematosus: a nationwide cohort study in Denmark[J]. Lupus, 2018, 27(9): 1424-1430. DOI: 10.1177/0961203318777103.
40.Durosaro O, Davis MD, Reed KB, et al. Incidence of cutaneous lupus erythematosus, 1965-2005: a population-based study[J]. Arch Dermatol, 2009, 145(3): 249-253. DOI: 10.1001/archdermatol.2009.21.
41.Maillet M, Tounkara BS, Vagner D, et al. Epidemiology of isolated cutaneous lupus erythematosus in the multiethnic population of Reunion Island: a retrospective multicenter study[J]. J Rheumatol, 2025, 52(3): 251-256. DOI: 10.3899/jrheum.2024-0661.
42.Lusk JB, Choi S, Clark AG, et al. Dementia and Parkinson's disease diagnoses in electronic health records vs. medicare claims data: a study of 101,980 linked patients[J]. BMC Neurol, 2023, 23(1): 325. DOI: 10.1186/s12883-023-03361-w.
43.Choi YC, Zhang D, Tyczynski JE. Comparison between health insurance claims and electronic health records (EHRs) for metastatic non-small-cell lung cancer (NSCLC) patient characteristics and treatment patterns: a retrospective cohort study[J]. Drugs Real World Outcomes, 2021, 8(4): 577-587. DOI: 10.1007/s40801-021-00269-0.
44.Laws MB, Michaud J, Shield R, et al. Comparison of electronic health record-based and claims-based diabetes care quality measures: causes of discrepancies[J]. Health Serv Res, 2018, 53 (Suppl 1): 2988-3006. DOI: 10.1111/1475-6773.12819.
45.Carrell DS, Gruber S, Floyd JS, et al. Improving methods of identifying anaphylaxis for medical product safety surveillance using natural language processing and machine learning[J]. Am J Epidemiol, 2023, 192(2): 283-295. DOI: 10.1093/aje/kwac182.