罕见病由于发病率和患病率极低、遗传机制复杂、临床表型多样,其临床研究面临巨大的诊疗挑战。罕见病的临床研究与一般临床研究在方案设计方面原则上并无显著差异,其难点主要在于罕见病自身的独特性,将一般临床研究中存在的挑战和局限性进一步放大,通常涉及数据采集、数据管理、技术方法、伦理法规、患者参与五个方面。然而,随着信息技术、人工智能、区块链等数智化技术的快速发展,尤其是这些技术在数据采集、存储、分析、共享、管理领域的创新应用,为罕见病临床研究的实施与优化带来新的机遇。借助数智化技术开展罕见病临床研究的策略,多应用于以下几个方面:基于数智化注册登记平台的罕见病临床研究与患者管理;研发数智化技术驱动的辅助诊断技术,以提高罕见病诊断的准确度;数智化技术助力“去中心化”罕见病临床研究的开展;以及数智化技术推动多源和多模态数据融合等。尽管在应用过程中,逐渐发现一些数据隐私、算法公平性、伦理规范等方面的新挑战,但随着技术的不断成熟和伦理框架的完善,数智化驱动的罕见病临床研究依然充满希望。
罕见病由于发病率和患病率极低、遗传机制复杂、临床表型多样,其临床研究面临巨大的诊疗挑战[1]。传统针对罕见病诊疗技术的临床研究主要依赖小样本临床试验、观察性研究和病例个案报道。有限的样本量不仅降低了研究结果的外推性和可重复性,还制约了对罕见病发病机制的探索与新型诊疗技术的研发。然而,随着信息技术、人工智能(artificial intelligence,AI)、区块链等数智化技术的迅速发展,尤其是在数据采集、存储、分析、共享、管理领域的创新应用,为罕见病临床研究的开展和优化带来了新的机遇。当前,数智化技术在常见病临床研究中的应用不仅提升了数据采集的效率和准确性,还推动临床研究实施过程的标准化、统一化和智能化,增强了研究结果的可重复性和外推性。与常见病不同,罕见病因病例稀少且较为分散,加大了临床研究的实施难度;此外,在传统结构化数据的基础上,罕见病临床研究还涉及影像检查、超声检查、核医学检查、病理检查、基因测序、个体化监测等多模态数据。如何通过精准分析从海量数据中提取有价值的信息,进而实现罕见病的早期诊断、靶向治疗及个体化照护,也是当前面临的巨大挑战。本文围绕罕见病临床研究中数据采集与管理方面的难点,系统梳理已开展的数智化技术应用现状、面临的挑战及未来发展方向,为推动数智化驱动的罕见病临床研究的发展与优化提供新思路和新方法。
1 罕见病临床研究数据采集与管理难点
罕见病的临床研究与一般临床研究在方案设计、方案实施、偏倚控制等方面并无显著差异,存在的难点主要是罕见病的独特性放大了一般临床研究中存在的挑战和局限性,这些问题通常涉及数据采集、数据管理、技术方法、伦理法规、患者参与5个方面,具体可概括为八大难点,见表1。
1.1 病例稀少,难以快速招募患者并高效采集数据
罕见病极低的发病率和患病率是导致患者招募困难的主要原因[1]。以肌萎缩侧索硬化症(amyotrophic lateral sclerosis,ALS)为例,其全球患病率约为4.42/100 000[2],意味着即使在人口密集的地区,患者数量也极为有限,其中符合研究纳入标准的患者更少。而样本量是确保临床研究统计效能(statistical power)的关键因素[3],若样本量不足,可能导致在投入大量人力、物力、财力和时间后,仍无法获得有价值的研究结果。
1.2 诊断困难,患者间异质性较大,导致研究数据准确度和标准化不足
罕见病患者平均经历4~5年的诊断延迟[4],且大多数患者在确诊前有被误诊的经历。临床表现复杂且异质性高[5]、医务人员认知不足以及诊断技术匮乏是导致这一现象的主要原因。例如,囊性纤维化常累及呼吸系统、消化系统和生殖系统,出现多重症状,且严重程度各异,医生仅依据单一症状或常规检查难以快速识别,进而造成误诊或漏诊[6];即使对于相对常见的罕见病,如ALS,要准确鉴别其早期症状与颈椎病或周围神经病变,对医务人员而言也是巨大挑战。这导致在大范围、多中心的罕见病临床研究中,数据采集的准确性和规范性较差。
1.3 传统中心化的罕见病临床研究实施困难
单病种罕见病患者数量极少且分布分散,使得传统中心化临床研究面临患者组织难度大的问题。例如,中国已登记戈谢病(Gaucher disease)患者总数不足1 000例[7],却分散在全国31个省、市、自治区的多家医疗机构中,导致固定中心的临床研究难以招募足够数量的研究对象。同时,患者在参与中心化临床研究的过程中需要承担的巨大经济成本和时间成本,也限制了患者参与研究的热情和积极性[3, 8]。
1.4 罕见病多源和多模态数据难以融合
罕见病临床研究常涉及多来源、多模态数据,包括基因组学数据、临床表型数据、影像学数据、患者报告结局(patient reported outcomes,PROs)等。这些数据存在的异质性和非结构化特性,增加了数据采集和管理的难度[9]。同时,罕见病研究领域的“数据孤岛”现象更为常见,数据整合也成为一大难题[10]。例如,美国“All of Us”项目已整合10万例罕见病患者的电子病历,但其多模态数据的整合率不足30%[11],低效的数据整合使项目中部分研究难以推进,如一项针对ALS的临床试验因数据质量较差而被迫中止 [12]。多模态数据整合困难主要受两方面因素影响:①不同来源、不同模态的数据缺乏统一标准[13-14],欧洲罕见病组织(Rare Diseases Europe,EURORDIS)的调查[15]显示,超过60%的罕见病临床研究因数据标准不统一而无法整合;②现有信息平台难以支持多模态数据的整合应用。例如,基因组数据与临床表型数据的关联分析需要专门的生物信息学工具,这些工具不仅使用门槛高,且兼容性较差[16]。
1.5 小样本数据的高效分析难以实现
小样本导致的统计效能降低是罕见病临床研究失败的常见原因之一[17]。例如,Avadhanula等[18]在125例尿黑酸尿症患者中筛查出1例确诊的甲状腺功能亢进症患者(患病率为0.8%),但统计检验未发现该群体的患病率与一般人群(0.5%)相比存在显著差异(P=0.88)。同时,较小的样本量也使得针对数据噪声的敏感性分析或亚组分析难以开展,进而降低了研究结果的稳健性[19]。近年来,机器学习(machine learning,ML)算法的广泛应用虽打破了对数据分布的部分限制,提升了对不同类型数据的包容性,但训练样本不足仍可导致过拟合现象[20]。
1.6 罕见病临床研究数据涉及更多的患者隐私
罕见病临床研究数据涉及患者大量的敏感信息,如基因序列、组学信息、生物样本信息等[21]。这些信息一旦泄露,可能给患者及家庭带来严重的安全隐患和心理伤害。而患者及其家属对隐私问题的担忧,也会影响其参与临床研究的积极性[22]。
1.7 罕见病研究数据缺乏有效共享
数据共享在罕见病研究中面临多重障碍,如隐私问题、数据标准化不足等,导致数据难以整合和利用[23-24]。研究[24]显示,欧洲罕见病登记系统的数量逐年增加,但仅有部分登记系统可实现数据共享,且共享数据量在数据总量中所占比例较低。数据共享难度大、共享率低,导致大量数据被浪费和重复采集。罕见病数据共享困难可能源于以下方面:①隐私保护与伦理问题,罕见病研究数据包含患者大量敏感信息,对这些信息的保护限制了共享的程度[24];②罕见病数据标准化程度低, 罕见病数据稀少且术语不一致,难以完全符合可查找、可访问、可互操作、可复用的“FAIR”原则[25-26];③技术与基础设施限制,罕见病患者数量少但临床特征明显,即便去除患者的身份识别信息,也可能通过间接信息(如年龄、性别、居住地等)被重新识别,造成隐私泄露[27]。上述原因使得罕见病数据共享需要强大的技术支持和基础设施保障,包括安全的存储平台[28]、高效的数据传输工具[29]和先进的分析软件[30]。
1.8 罕见病临床研究周期长,患者失访严重
病例稀少、诊断难度大使罕见病临床研究比常见病需要更长的周期,而长周期会增加患者参与研究的时间成本和经济成本,降低其参与度和依从性[31-32]。例如,2019年的一项研究[1]发现,超过一半的罕见病临床研究在开展4年后终止或研究成果未能发表。此外,罕见病患者就医流动性大、个体行动不便等因素也使研究随访难度增加。约75%的罕见病患者每年就诊3次及以上,近一半的患者每年就诊5次及以上,平均就诊次数为4.16次[33]。
2 基于数智化技术的应对策略
围绕上述难点与挑战,本研究系统梳理了数智化技术在罕见病临床研究数据采集与管理过程中的应用案例,具体如下。
2.1 开展基于信息化登记平台的罕见病临床研究与患者管理
针对研究对象难以招募的问题,欧美等国家逐步开展了基于注册登记的罕见病临床研究,即通过病例登记的方式将临床诊疗中发现的罕见病患者组织起来,建立患者信息库,如欧盟的Orphanet数据库和美国的NORD数据库均属于此类,且会对患者进行长期随访管理。当开展临床研究时,便可以基于这些信息库实现患者的快速招募。中国于2016年正式启动罕见病病例注册工作,建立了中国国家罕见病注册系统(National Rare Diseases Registry System of China,NRDRS)[34]。截至目前,NRDRS已完成我国罕见病患者信息和生物样本资源的初步积累,共建立245个罕见病研究队列,覆盖214种/类罕见病,注册患者92 493例,其中41 767例患者接受了定期随访;此外,还完备保存了26 500例患者的生物样本(包括全血、血浆、血清、尿、便、机体组织等),采集了28 069例患者的基因测序数据。这些资源为临床试验/研究的开展提供了有力支持,推动了罕见病知识和诊疗方案的革新。同时,依托注册平台,利用移动终端或可穿戴设备实现患者信息的远程采集与实时传输[35],这一方式显著降低了数据采集难度,提高了患者管理效率。
2.2 研发数智化驱动的辅助诊断技术,提高罕见病诊断的准确度
数智化驱动的辅助诊断技术,能显著提升罕见病诊断的一致性和准确性。例如,基于AI的临床决策支持系统(clinical decision support system,CDSS)可通过分析患者多模态数据,协助医生识别潜在的罕见病患者[36];将AI算法与患者的运动功能评分(如Hammersmith功能运动量表)、肌电图数据和基因测序数据相整合,构建出的脊髓性肌萎缩症(spinal muscular atrophy,SMA)辅助诊断模型,判断准确率可达92%[37];某辅助诊断系统借助深度学习技术分析患者的电子健康记录(electronic health records,EHR),对可能罹患的罕见病进行预测,显著提升了临床诊断效率[38]。此外,AI方法有助于建立集中化的计算机辅助的罕见疾病患者注册系统,进一步强化患者识别和健康管理。例如,香港首个针对罕见病的计算机辅助患者识别工具在接受先天性代谢缺陷病(inborn errors of metabolism,IEM)相关检测的患者中识别出100例疑似IEM患者,经过病理检查,其中96例确诊为IEM患者。与此前发表的IEM队列数据相比,该工具的灵敏度可达92.3%[39]。
2.3 数智化技术助力“去中心化”罕见病临床研究开展
“去中心化”研究模式虽然降低了患者参与临床研究的经济负担和时间成本[40],但如何确保不同中心在方案实施、数据采集与管理、数据融合等方面的同质化,又成为新的挑战。区块链技术凭借去中心化结构、加密安全性和智能合约,显著增强了各平台上健康数据的隐私性、安全性和共享性,为多中心数据收集提供了便利[41]。此外,“区块链+分布式账本技术(distributed ledger technology,DLT)”能够实现带时间戳数据的安全记录[42]。这些“去中心化”研究策略与技术的应用,不仅打破了罕见病研究的资源限制,也为构建全球罕见病真实世界研究体系奠定了技术基础[43]。
2.4 数智化技术推动多源/多模态数据的融合与隐私保护
2.4.1 AI驱动的多模态数据融合平台
Gestalt-MML是一种基于多模态机器学习(multimodal machine learning,MML)的模型[44],专门用于罕见遗传病的早期诊断和预警。该模型整合了患者的面部图像(如照片、影像等)和临床文本数据(如病历记录、临床表型记录等),采用深度学习技术进行分析处理,最终通过特征级或决策级融合等机制,将图像与文本数据整合到统一的模型中。
2.4.2 基于区块链技术的数据分布式存储与整合
通过区块链技术,可实现多机构间数据的分布式存储、权限管理和实时加密整合应用,有效解决数据孤岛问题。例如,罕见病公共数据模型(rare disease-common data model,RD-CDM)借助区块链技术实现了数据的加密存储和安全共享,为罕见病数据的标准化和互操作性提供了支持[45];区块链与星际文件系统(InterPlanetary File System,IPFS)的集成技术,通过优化算法改进访问控制,提升了患者信息的完整性与检索便捷性,使利益相关者之间能够安全共享信息[46]。此外,“区块+智能合约”技术改进了临床研究中的数据来源管理,为防止篡改数据的处理提供了安全方法,并通过智能合约推动了临床试验的自动化[47]。
2.4.3 联邦学习框架
联邦学习(federated learning,FL)框架在罕见病多源及多模态数据融合中,在数据隐私保护、跨机构协作和算法优化方面颇具优势。例如,联邦生态系统(federated ecosystem)通过共享基因组学和临床数据,推动了罕见病等领域的研究与临床应用[48]。针对分布式的罕见病数据,FL允许在不共享数据的情况下联合训练模型。研究[49]显示,混合卷积神经网络结合长短期记忆网络(convolutional neural network and long short-term memory network,CNN-LSTM)与FL技术的应用,让多家医院能够在不共享患者原始数据的情况下协作训练罕见疾病数据模型。各机构先训练本地模型,仅向中央服务器共享模型更新,再由中央服务器将这些更新汇总为全局模型。该方法提升了模型的泛化能力,增加了对罕见病的检测能力。在算法优化方面,由于罕见病数据通常属于非独立同分布(non-independent identically distribution,Non-IID)数据,FL通过FedProx、SCAFFOLD等优化算法提升模型性能,能够在保护数据隐私的同时,训练出接近全局模型性能的预测模型。例如,在UK Biobank数据的基因表型预测研究[50]中,FL模型在多种表型的预测表现上接近全局模型,且显著优于本地模型。
2.5 数智化技术实现小样本数据的高效分析
在传统随机对照试验中,当样本量较小时,统计结果容易受到样本数量微小变化的影响[17, 51]。例如,在Avadhanula等[18]的研究中,125例尿黑酸尿症患者中发现1例甲状腺功能亢进症患者(占比0.8%),通过Fisher精确检验,未发现该患病率与一般人群中的估计患病率(0.5%)存在显著差异(P=0.88)。假设检出人数为2例,采用同样的统计方法得到P=0.23;当检出人数为3例时得到P=0.04,此时差异有统计学意义。然而,生成式AI、贝叶斯方法与迁移学习的应用,为罕见病小样本数据的高效分析提供了突破性解决方案。生成式对抗网络(generative adversarial networks,GANs)可用于生成合成数据,弥补罕见病数据不足的问题。例如,在罕见皮肤病研究中,GANs能生成逼真的皮肤病变图像,帮助训练更准确的诊断模型[52]。贝叶斯推断法在数据有限的情况下也能进行有效分析,为罕见病研究的开展和数据高效分析提供了支持[53]。例如,分层贝叶斯模型通过整合多个数据源(如自然史研究、临床试验数据等),能更准确地描述中央核性肌病(centronuclear myopathy,CNM)的疾病进展模式;该模型考虑了不同患者的基因型和表型差异,为临床试验设计提供了更精准的预测和决策支持[54]。
2.6 数智化技术助力罕见病研究数据安全共享
区块链与FL等技术正在重塑罕见病数据共享生态,为突破数据孤岛、保护患者隐私提供了可行路径。使用唯一标识符有助于关联多个研究和试验中的患者数据,在保障隐私安全前提下促进数据融合[55]。例如,美国的全球罕见病患者登记和数据储存库(Global Rare Diseases Patient Registry Data Repository,GRDR)通过标准化术语汇总去标识化的患者数据,为研究人员广泛访问数据库提供了便利[55]。此外,数字卫生技术借助自动捕获和增强的可追溯性,提高了数据收集的效率和可靠性;同时,这些技术还加强了数据安全性、透明度和知情同意流程,而这些对于处理罕见病患者的隐私信息至关重要[56]。
2.7 数智化技术完善了患者管理方案,提高患者依从性
数智化技术的整合优化了远程患者管理与随访数据采集流程。可穿戴设备等远程患者管理技术、远程随访平台、虚拟技术等在罕见病康复和治疗指导中也取得了显著成效。例如,在远程患者管理(remote patient management,RPM)技术中,以法布雷病(Fabry disease)为例,相关应用程序通过加密技术保障患者数据安全,允许患者记录并传输其症状信息,为医疗专业人员提供了实时监测工具[57]。此外,患者借助可穿戴设备(如智能手环)实时监测肌肉功能及呼吸参数,结合远程康复指导系统开展个性化训练,能有效提高患者依从性[58]。数智化技术在罕见病研究数据采集与管理中的应用现状,见表2。
3 不同经济发展水平国家或地区的比较分析
罕见病的研究与管理在全球范围内面临普遍挑战,由于不同国家与地区经济发展水平存在差异,应对策略也有所不同。在欧美等高收入国家和地区,尽管已建立起如Orphanet数据库、NORD数据库等完善的患者登记体系和生物样本管理体系,但病例稀少和诊断异质性仍给患者招募与数据标准化带来挑战。其首要应对策略是优化现有信息化平台的互联互通,并积极应用前沿数智化技术。例如,通过AI驱动的辅助诊断技术和多模态数据融合平台提升诊断准确性,利用FL框架在保护隐私前提下,实现小样本数据的高效分析与安全共享。此外,这些国家还率先推出去中心化临床试验(decentralized clinical trials,DCTs),以提高患者参与度和研究效率。中国等中等收入国家近年来在罕见病患者注册方面进展显著,但庞大的人口基数、医疗资源分布不均衡及数据孤岛问题,使得患者识别、数据标准化和多源数据融合仍是重大挑战。目前采用的首要应对策略是大力推进数智化基础设施建设,平衡技术发展与伦理法规,例如利用区块链技术实现数据的分布式存储与整合,积极探索数智化技术助力的“去中心化”临床研究。低收入国家则面临更为基础的挑战,包括缺乏国家层面的病例登记制度,以及必需的诊断技术和设备。由于这些国家尚不具备数智化技术的应用基础,当前的应对策略仍是加快建立基本医疗保障体系,加强对已确诊罕见病患者的持续随访与管理,在此过程中可借助相对便捷、易于掌握的数智化工具提高工作效率。
4 结语
综上,数智化技术在罕见病临床研究数据采集与管理中的应用已展现出显著优势,解决了长期制约罕见病临床研究开展的难点。但在应用过程中,也逐渐发现一些新的挑战:①罕见病研究数据具有较高的异质性,这增加了模型的训练难度,也提高了过拟合的风险;②数智化技术的应用成本高昂,难以在经济欠发达地区和基层医疗卫生机构大范围推广;③掌握数智化技术的专业人才不足,成为限制技术应用的核心因素;④数智化技术的应用需要对研究数据进行反复使用(如模型的更新与迭代),且会产生新的数据(如数据孪生),但目前对于数据反复使用和新生数据的伦理监管尚无明确规范,传统的“一次性”知情同意模式是否适用于数智化技术也有待探索;⑤数智化技术和算法的“黑箱”特性可能导致结果难以解释,由此产生的错误或偏差如何控制,仍是需要解决的问题。
尽管在数据隐私、算法公平性、伦理规范等方面仍存在诸多挑战,但随着技术的不断成熟和伦理框架的逐步完善,数智化驱动的罕见病临床研究充满希望。相信在科研人员、技术开发者、患者及社会各界的共同努力下,数智化技术将为罕见病临床研究开辟更广阔的前景,最终为患者带来更精准的诊断和更有效的治疗方案。
利益冲突声明:作者声明本研究不存在任何经济或非经济利益冲突。
1.Rees CA, Pica N, Monuteaux MC, et al. Noncompletion and nonpublication of trials studying rare diseases: a cross-sectional analysis[J]. PLoS Med, 2019, 16(11): e1002966. DOI: 10.1371/journal.pmed.1002966.
2.Chiò A, Logroscino G, Traynor BJ, et al. Global epidemiology of amyotrophic lateral sclerosis: a systematic review of the published literature[J]. Neuroepidemiology, 2013, 41(2): 118-130. DOI: 10.1159/000351153.
3.Tudur Smith C, Williamson PR, Beresford MW. Methodology of clinical trials for rare diseases[J]. Best Pract Res Clin Rheumatol, 2014, 28(2): 247-262. DOI: 10.1016/j.berh.2014.03.004.
4.Yan X, He S, Dong D. Determining how far an adult rare disease patient needs to travel for a definitive diagnosis: a cross-sectional examination of the 2018 National Rare Disease Survey in China[J]. Int J Environ Res Public Health, 2020, 17(5): 1757. DOI: 10.3390/ijerph17051757.
5.Nestler-Parr S, Korchagina D, Toumi M, et al. Challenges in research and health technology assessment of rare disease technologies: report of the ISPOR Rare Disease Special Interest Group[J]. Value Health, 2018, 21(5): 493-500. DOI: 10.1016/j.jval.2018.03.004.
6.De Boeck K, Amaral MD. Progress in therapies for cystic fibrosis[J]. Lancet Respir Med, 2016, 4(8): 662-674. DOI: 10.1016/s2213-2600(16)00023-0.
7.中国罕见病联盟,编著. 中国罕见病诊疗指南[M]. 北京: 人民卫生出版社, 2019: 95-97.
8.Kaufmann P, Pariser AR, Austin C. From scientific discovery to treatments for rare diseases-the view from the National Center for Advancing Translational Sciences-Office of Rare Diseases Research[J]. Orphanet J Rare Dis, 2018, 13(1): 196. DOI: 10.1186/s13023-018-0936-x.
9.Kerr K, Mcaneney H, Mcknight AJ. Protocol for a scoping review of multi-omic analysis for rare diseases[J]. BMJ Open, 2019, 9(5): e026278. DOI: 10.1136/bmjopen-2018-026278.
10.Nesbitt GC, Murphy P A. CRID-A unique, universal, patient-generated identifier to facilitate collaborative rare disease clinical research[J]. Inform Med Unlocked, 2022, 31: 100973. DOI: 10.1016/j.imu.2022.100973.
11.Bates BA, Bates KE, Boris SA, et al. Intersection of rare pathogenic variants from TCGA in the All of Us Research Program v6[J]. HGG Adv, 2025, 6(2): 100405. DOI: 10.1016/j.xhgg.2025.100405.
12.Goyal NA, Berry JD, Windebank A, et al. Addressing heterogeneity in amyotrophic lateral sclerosis CLINICAL TRIALS[J]. Muscle Nerve, 2020, 62(2): 156-166. DOI: 10.1002/mus.26801.
13.Qiao X, Lecours V, Braswell AE, et al. Identifying community practices in marine benthic data usage in Florida[J]. Ocean Coast Manage, 2024, 259: 107429. DOI: 10.1016/j.ocecoaman.2024.107429.
14.Raycheva R, Kostadinov K, Mitova E, et al. Challenges in mapping European rare disease databases, relevant for ML-based screening technologies in terms of organizational, FAIR and legal principles: scoping review[J]. Front Public Health, 2023, 11: 1214766. DOI: 10.3389/fpubh.2023.1214766.
15.Bookman RJ, Cimino JJ, Harle CA, et al. Research informatics and the COVID-19 pandemic: challenges, innovations, lessons learned, and recommendations[J]. J Clin Transl Sci, 2021, 5(1): e110. DOI: 10.1017/cts.2021.26.
16.Helzlsouer K, Meerzaman D, Taplin S, et al. Humanizing big data: recognizing the human aspect of big data[J]. Front Oncol, 2020, 10: 186. DOI: 10.3389/fonc.2020.00186.
17.Mitani AA, Haneuse S. Small data challenges of studying rare diseases[J]. JAMA Netw Open, 2020, 3(3): e201965. DOI: 10.1001/jamanetworkopen.2020.1965.
18.Avadhanula S, Introne WJ, Auh S, et al. Assessment of thyroid function in patients with alkaptonuria[J]. JAMA Netw Open, 2020, 3(3): e201357. DOI: 10.1001/jamanetworkopen.2020.1357.
19.Paulson DR, Ingleshwar A, Theis-Mahon N, et al. The correlation between oral and general health-related quality of life in adults: a systematic review and Meta-analysis[J]. J Evid Based Dent Pract, 2024, 25(1S): 102078. DOI: 10.1016/j.jebdp.2024.102078.
20.Wang Y, Zhang Y, Zhan X, et al. Machine learning for predicting protein properties: a comprehensive review[J]. Neurocomputing, 2024, 597: 128103. DOI: 10.1016/j.neucom.2024.128103.
21.Choon YW, Choon YF, Nasarudin NA, et al. Artificial intelligence and database for NGS-based diagnosis in rare disease[J]. Front Genet, 2023, 14: 1258083. DOI: 10.3389/fgene.2023.1258083.
22.Iyer AA, Barzilay JR, Tabor HK. Patient and family social media use surrounding a novel treatment for a rare genetic disease: a qualitative interview study[J]. Genet Med, 2020, 22(11): 1830-1837. DOI: 10.1038/s41436-020-0890-6.
23.Austin CP, Cutillo CM, Lau LPL, et al. Future of rare diseases research 2017-2027: an IRDiRC perspective[J]. Clin Transl Sci, 2018, 11(1): 21-27. DOI: 10.1111/cts.12500.
24.Kodra Y, Weinbach J, Posada-De-La-Paz M, et al. Recommendations for improving the quality of rare disease registries[J]. Int J Environ Res Public Health, 2018, 15(8): 1644. DOI: 10.3390/ijerph15081644.
25.Aymé S, Bellet B, Rath A. Rare diseases in ICD11: making rare diseases visible in health information systems through appropriate coding[J]. Orphanet J Rare Dis, 2015, 10: 35. DOI: 10.1186/s13023-015-0251-8.
26.Raycheva R, Kostadinov K, Mitova E, et al. Challenges in mapping European rare disease databases, relevant for ML-based screening technologies in terms of organizational, FAIR and legal principles: scoping review[J]. Front Public Health, 2023, 11: 1214766. DOI: 10.3389/fpubh.2023.1214766.
27.Gim N, Wu Y, Blazes M, et al. A clinician's guide to sharing data for AI in ophthalmology[J]. Invest Ophthalmol Vis Sci, 2024, 65(6): 21. DOI: 10.1167/iovs.65.6.21.
28.Uijterwijk BA, Lemmers DH, Moekotte AL, et al. Tackling challenges in rare diseases: the ISGACA approach on non-pancreatic cancers in the periampullary region[J]. Eur J Surg Oncol, 2024, 50(11): 108601. DOI: 10.1016/j.ejso.2024.108601.
29.Geneviève LD, Martani A, Perneger T, et al. Systemic fairness for sharing health data: perspectives from Swiss stakeholders[J]. Front Public Health, 2021, 9: 669463. DOI: 10.3389/fpubh.2021. 669463.
30.Zerka F, Urovi V, Bottari F, et al. Privacy preserving distributed learning classifiers-sequential learning with small sets of data[J]. Comput Biol Med, 2021, 136: 104716. DOI: 10.1016/j.compbiomed.2021.104716.
31.Evans EF, Shyr ZA, Traynor BJ, et al. Therapeutic development approaches to treat haploinsufficiency diseases: restoring protein levels[J]. Drug Discov Today, 2024, 29(12): 104201. DOI: 10.1016/j.drudis.2024.104201.
32.Gurevich E, Levi S, Borovitz Y, et al. Childhood hypercalciuric hypercalcemia with elevated vitamin D and suppressed parathyroid hormone: long-term follow up[J]. Front Pediatr, 2021, 9: 752312. DOI: 10.3389/fped.2021.752312.
33.Somanadhan S, Mcaneney H, Awan A, et al. Assessing the supportive care needs of parents of children with rare diseases in Ireland[J]. J Pediatr Nurs, 2025, 81: 31-42. DOI: 10.1016/j.pedn.2025.01.003.
34.郭健, 刘鹏, 荆志成, 等. 中国国家罕见病注册系统建设及应用[J]. 罕见病研究, 2022, 1(1): 7-12. [Guo J, Liu P, Jin ZC, et al. Construction and application of national rare diseases registry system of China[J]. Journal of Rare Diseases, 2022, 1(1): 7-12.] DOI: 10.12376/j.issn.2097-0501.2022.01.002.
35.郭健, 金晔, 刘鹏, 等. 中国国家罕见病注册系统数智化升级与临床应用[J]. 罕见病研究, 2025, 4(1): 54-60. [Guo J, Jin Y, Liu P, et al. Digital-intellectualized upgrade and clinical application of National Rare Diseases Registry System of China[J]. Journal of Rare Diseases, 2025, 4(1): 54-60.] DOI: 10.12376/j.issn.2097-0501.2025.01.008.
36.Hanna MG, Pantanowitz L, Dash R, et al. Future of artificial intelligence-machine learning trends in pathology and medicine[J]. Modern Pathology, 2025, 38(4): 100705. DOI: 10.1016/j.modpat.2025.100705.
37.Srivastava T, Darras BT, Wu JS, et al. Machine learning algorithms to classify spinal muscular atrophy subtypes[J]. Neurology, 2012, 79(4): 358-364. DOI: 10.1212/WNL.0b013e3182604395.
38.Rajkomar A, Oren E, Chen K, et al. Scalable and accurate deep learning with electronic health records[J]. NPJ Digit Med, 2018, 1: 18. DOI: 10.1038/s41746-018-0029-1.
39.Mak CM, Woo PPS, Song FE, et al. Computer-assisted patient identification tool in inborn errors of metabolism-potential for rare disease patient registry and big data analysis[J]. Clinica Chimica Acta, 2024, 561: 119811. DOI: 10.1016/j.cca.2024.119811.
40.Moore J, Goodson N, Wicks P, et al. What role can decentralized trial designs play to improve rare disease studies?[J]. Orphanet J Rare Dis, 2022, 17(1): 240. DOI: 10.1186/s13023-022-02388-5.
41.Rajput AR, Li Q, Ahvanooey MT. A blockchain-based secret-data sharing framework for personal health records in emergency condition[J]. Healthcare (Basel), 2021, 9(2): 206. DOI: 10.3390/healthcare9020206.
42.Houtan B, Senhaji Hafid A, Dias D. A survey on blockchain-based self-sovereign patient identity in healthcare[J]. IEEE Access, 2020, 8: 90478-90497. DOI: 10.1109/ACCESS.2020.2994090.
43.Khozin S, Coravos A. Decentralized trials in the age of real-world evidence and inclusivity in clinical investigations[J]. Clin Pharmacol Ther, 2019, 106(1): 25-27. DOI: 10.1002/cpt.1441.
44.Wu D, Yang J, Liu C, et al. GestaltMML: enhancing rare genetic disease diagnosis through multimodal machine learning combining facial images and clinical texts[J/OL]. ArXiv, 2312. [2024-04-22]. https://pmc.ncbi.nlm.nih.gov/articles/PMC11071539/.
45.Omidian H. Synergizing blockchain and artificial intelligence to enhance healthcare[J]. Drug Discovery Today, 2024, 29(9): 104111. DOI: 10.1016/j.drudis.2024.104111.
46.Marangappanavar RK, Kiran M. Inter-planetary file system enabled blockchain solution for securing healthcare records[A]//2020 Third ISEA Conference on Security and Privacy (ISEA-ISAP)[C]. IEEE, 2020: 171-178. DOI: 10.1109/ISEA-ISAP49340. 2020.235016.
47.Benchoufi M, Ravaud P. Blockchain technology for improving clinical research quality[J]. Trials, 2017, 18(1): 335. DOI: 10.1186/s13063-017-2035-z.
48.Global Alliance for Genomics and Health. GENOMICS. A federated ecosystem for sharing genomic, clinical data[J]. Science, 2016, 352(6291): 1278-1280. DOI: 10.1126/science.aaf6162.
49.Nagamani GM, Kumar CK. Design of an improved graph-based model for real-time anomaly detection in healthcare using hybrid CNN-LSTM and federated learning[J]. Heliyon, 2024, 10(24): e41071. DOI: 10.1016/j.heliyon.2024.e41071.
50.Kolobkov D, Mishra Sharma S, Medvedev A, et al. Efficacy of federated learning on genomic data: a study on the UK Biobank and the 1000 Genomes project[J]. Front Big Data, 2024, 7: 1266031. DOI: 10.3389/fdata.2024.1266031.
51.Zhao Z, Wang R, Liu M, et al. Application of machine vision in food computing: a review[J]. Food Chem, 2025, 463(Pt 4): 141238. DOI: 10.1016/j.foodchem.2024.141238.
52.Mutepfe F, Kalejahi BK, Meshgini S, et al. Generative adversarial network image synthesis method for skin lesion generation and classification[J]. J Med Signals Sens, 2021, 11(4): 237-252. DOI: 10.4103/jmss.JMSS_53_20.
53.Burton PR, Gurrin LC, Campbell MJ. Clinical significance not statistical significance: a simple Bayesian alternative to P values[J]. J Epidemiol Community Health, 1998, 52(5): 318-323. DOI: 10.1136/jech.52.5.318.
54.Fouarge E, Monseur A, Boulanger B, et al. Hierarchical Bayesian modelling of disease progression to inform clinical trial design in centronuclear myopathy[J]. Orphanet J Rare Dis, 2021, 16(1): 3. DOI: 10.1186/s13023-020-01663-7.
55.Mascalzoni D, Paradiso A, Hansson M. Rare disease research: Breaking the privacy barrier[J]. Appl Transl Genom, 2014, 3(2): 23-29. DOI: 10.1016/j.atg.2014.04.003.
56.Bitanihirwe B, Ssewanyana D, Ddumba-Nyanzi I. Pacing forward in the face of fragility: lessons from African institutions and governments' response to public health emergencies[J]. Front Public Health, 2021, 9: 714812. DOI: 10.3389/fpubh.2021. 714812.
57.D'amore S, Mckie M, Fahey A, et al. Fabry App: the value of a portable technology in recording day-to-day patient monitored information in patients with Fabry disease[J]. Orphanet J Rare Dis, 2024, 19(1): 13. DOI: 10.1186/s13023-023-02999-6.
58.Wettstein R, Sedaghat-Hamedani F, Heinze O, et al. A remote patient monitoring system with feedback mechanisms using a smartwatch: concept, implementation, and evaluation based on the activeDCM Randomized controlled trial[J]. JMIR Mhealth Uhealth, 2024, 12: e58441. DOI: 10.2196/58441.
59.Weber JS, Sznol M, Sullivan RJ, et al. A serum protein signature associated with outcome after anti-PD-1 therapy in metastatic melanoma[J]. Cancer Immunol Res, 2018, 6(1): 79-86. DOI: 10.1158/2326-6066.Cir-17-0412.
60.Hu J, Cui C, Yang W, et al. Using deep learning to predict anti-PD-1 response in melanoma and lung cancer patients from histopathology images[J]. Transl Oncol, 2021, 14(1): 100921. DOI: 10.1016/j.tranon.2020.100921.
61.Shaban-Nejad A, Michalowski M, Buckeridge DL. Health intelligence: how artificial intelligence transforms population and personalized health[J]. NPJ Digit Med, 2018, 1: 53. DOI: 10.1038/s41746-018-0058-9.
62.Gupta R, Srivastava D, Sahu M, et al. Artificial intelligence to deep learning: machine intelligence approach for drug discovery[J]. Mol Divers, 2021, 25(3): 1315-1360. DOI: 10.1007/s11030-021-10217-3.
63.Zhong F, Xing J, Li X, et al. Artificial intelligence in drug design[J]. Sci China Life Sci, 2018, 61(10): 1191-1204. DOI: 10.1007/s11427-018-9342-2.
64.Holzinger A, Haibe-Kains B, Jurisica I. Why imaging data alone is not enough: AI-based integration of imaging, omics, and clinical data[J]. Eur J Nucl Med Mol Imaging, 2019, 46(13): 2722-2730. DOI: 10.1007/s00259-019-04382-9.
65.Dagher GG, Mohler J, Milojkovic M, et al. Ancile: privacy-preserving framework for access control and interoperability of electronic health records using blockchain technology[J]. Sustain Cities Soc, 2018, 39: 283-297. DOI: 10.1016/j.scs.2018.02.014.
66.Naz M, Al-Zahrani FA, Khalid R, et al. A secure data sharing platform using blockchain and IPFS[J]. Sustainability, 2019, 11(24): 7054. DOI: 10.3390/su11247054.
67.Jamil F, Ahmad S, Iqbal N, et al. Towards a remote monitoring of patient vital signs based on iot-based blockchain integrity management platforms in smart hospitals[J]. Sensors (Basel), 2020, 20(8): 2195. DOI: 10.3390/s20082195.
68.Alshehri M. Blockchain-assisted cyber security in medical things using artificial intelligence[J]. Electron Res Arch, 2022, 31: 708-728. DOI: 10.3934/era.2023035.
69.Mahammad AB, Kumar R. Scalable and security framework to secure and maintain healthcare data using blockchain technology[C]. 2023 International Conference on Computational Intelligence and Sustainable Engineering Solutions (CISES), 2023: 417-423.
70.Li X, Wang Y, Wang D, et al. Improving rare disease classification using imperfect knowledge graph[J]. BMC Med Inform Decis Mak, 2019, 19(Suppl 5): 238. DOI: 10.1186/s12911-019-0938-1.