目的 基于转录组学与机器学习算法,研究恒格列净治疗糖尿病肾病(DKD)的潜在关键靶点,并构建微小RNA(miRNA)-信使RNA(mRNA)调控网络,解析其分子作用机制。
方法 整合公共数据库获取恒格列净作用靶点,并通过DAVID平台进行KEGG通路富集分析。结合GEO数据库中DKD患者的转录组数据,使用R语言软件筛选差异表达基因(DEGs),采用最小绝对收缩和选择算子(LASSO)回归、支持向量机-递归特征消除(SVM-RFE)与随机森林(RF)三种机器学习算法取交集识别疾病核心基因。利用ENCORI数据库预测上游miRNAs,构建调控网络。
结果 共获得8 214个DKD患者的mRNA表达数据,筛选出69个DEGs,结合机器学习算法最终得到 8 个关键基因。功能富集显示,核心基因与恒格列净靶点通路高度富集于磷脂酰肌醇3激酶(PI3K)/蛋白激酶B(Akt)信号通路。
结论 恒格列净可能通过调控PI3K/Akt通路及其相关miRNA-mRNA网络改善DKD进展,核心靶点具有潜在的监测与干预价值,本研究为恒格列净在DKD患者中的精准应用提供依据。
糖尿病肾病(diabetic kidney disease,DKD)是糖尿病患者常见的微血管并发症之一[1]。流行病学研究[2]显示,随着糖尿病患病率的持续上升,DKD的发病规模也在持续增长,成为全球公共健康领域面临的重要挑战。现有干预手段包括血糖管理、血压控制、使用肾素-血管紧张素系统抑制剂等[3],使用但仍缺乏能够从病理机制层面延缓疾病进展的有效策略。
近年来,钠-葡萄糖共转运蛋白2(sodium-glucose cotransporter 2,SGLT2)抑制剂因其降糖作用及对肾脏与心血管的保护效应而备受关注[4-5]。恒格列净作为一种选择性SGLT2抑制剂,独立于胰岛系统,直接作用于肾脏,通过抑制肾小管葡萄糖重吸收实现降糖效应[6],并在血压调控、体重管理、尿蛋白改善及炎症抑制等方面表现出多重获益[7]。然而,在临床上观察到的获益无法完全从其降糖效应来解释,提示恒格列净可能通过更深层的分子通路影响 DKD 的进展。
随着高通量测序与生物信息学的发展,转录组分析结合机器学习算法已广泛应用于疾病关键基因筛选与机制探索[8]。差异表达分析联合最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归、支持向量机-递归特征消除(support vector machine-recursive feature elimination,SVM-RFE)及随机森林(random forest,RF)等机器学习算法,可有效识别在疾病发生发展中具有核心作用的基因。同时,微小RNA(microRNA,miRNA)为重要的转录后调控因子,在炎症反应、代谢重编程及肾脏细胞损伤等过程中发挥核心作用[9],其介导的 miRNA-信使RNA(messenger RNA,mRNA)网络可能是药物调节信号通路的重要关键点。
基于此,本研究从转录组、机器学习、miRNA-mRNA 网络多层面系统解析恒格列净治疗DKD的作用机制,及其改善 DKD 的潜在信号通路与核心分子,为临床应用提供新的理论支持。
1 资料与方法
1.1 药物靶点筛选与通路富集分析
从PubChem数据库获取恒格列净的二维结构(CID: 11949646)。使用Swiss Target Prediction平台(http://www.swisstargetprediction.ch/)预测恒格列净的潜在靶点,筛选物种限定为“homo sapiens”。将预测得到的靶点导入DAVID数据库(https://david.ncifcrf.gov/),选择物种为“homo sapiens”,进行京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析。以P<0.05为具有统计学意义,并结合通路涉及的基因数量及与 DKD 的病理生理关联性,筛选出排名靠前的 8 条核心通路。
1.2 DKD患者mRNA数据集获取
从NCBI-GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)以“diabetic kidney disease”和“diabetic nephrology”为关键词检索,限定物种为“homo sapiens”,筛选获得与 DKD 相关的人类 mRNA 数据集。各数据集的样本分组信息均依据其原始研究提供的样本注释进行确定,不进行额外重新定义;排除原始研究中标注为合并其他肾脏疾病或伴随急性肾损伤的样本。
1.3 mRNA 数据的标准化处理与批次效应校正
筛选得到的GSE30529、GSE96804和GSE104954
数据集,利用 R 语言中的“limma”包进行背景校正、log2 转换及量化标准化。并采用“sva”包中的 ComBat 方法对合并后的表达矩阵进行批次效应校正[10]。
1.4 DEGs功能富集分析与通路筛选
使用DAVID数据库(https://david.ncifcrf.gov/)对差异表达基因(differentially expressed genes,DEGs)进行基因本体(gene ontology,GO)和KEGG富集分析,设定物种为“homo sapiens”。在GO分析中选取前10项结果进行重点讨论;在KEGG分析中,剔除与DKD无关的通路,确定10条关键通路用于进一步研究。所有分析结果通过在线可视化工具进行展示。
1.5 机器学习算法筛选DKD核心基因及评估诊断价值
使用LASSO回归模型、SVM-RFE模型及RF模型三种机器学习算法筛选DKD的核心基因。使用R语言中的“glmnet”包进行LASSO回归,以DEGs为输入变量,样本分组为响应变量。惩罚参数λ通过10折交叉验证(cv.glmnet函数,family=“binomial”,alpha=1)确定,在最小化均方误差的条件下筛选非零系数基因作为候选核心基因。SVM-RFE 模型采用 “e1071”包构建支持向量机分类器,并使用 “caret”包中的 rfe 函数进行递归特征消除。核函数设定为径向基核(radial basis function,RBF),通过 10 折交叉验证选择最优特征子集,筛选出在最优模型中保留的基因。RF模型采用 “randomForest”包实现,设定决策树数目(ntree)为500,节点分裂时候选变量数(mtry)取默认值。通过计算每个基因的平均精度下降值(mean decrease accuracy)与基尼指数(mean decrease Gini)评估特征重要性。将三种方法各自筛选出的DEGs取交集,作为恒格列净治疗DKD的核心mRNA。随后使用R语言中的“limma”包对筛选出的核心mRNA在2组样本中的表达差异进行分析,使用“ggpubr”包绘制小提琴图展示分析结果,同时使用“pROC”包构建核心基因的受试者工作特征(receiver operating characteristic,ROC)曲线[11],计算曲线下面积(area under the curve,AUC),以评估预测能力。
1.6 构建miRNA-mRNA调控网络
借助ENCORI数据库,将机器学习筛选出的核心mRNA对其上游潜在靶向miRNA进行预测。随后,采用Cytoscape 3.10.3软件构建miRNA-mRNA调控网络,并结合FunRich软件对miRNA进行功能富集注释,最后对miRNA相关通路与药物靶点通路的重叠情况进行比较分析。
2 结果
2.1 药物靶点与通路分析
共获得200个药物靶点,KEGG通路富集分析得到148条信号通路。进一步筛选出与DKD密切相关且P<0.05的前8条通路,包括叉头框蛋白O(forkhead box O,FoxO)信号通路、丝裂原激活蛋白激酶(mitogen activation protein kinase,MAPK)信号通路、磷脂酰肌醇3激酶(phosphatidylinositol-3-kinase,PI3K)/蛋白激酶B( protein kinase B,Akt)信号通路、低氧诱导因子(hypoxia-inducible factor,HIF)-1信号通路、肾素-血管紧张素系统、胰岛素信号通路、淀粉与蔗糖代谢通路及胰岛素抵抗通路。利用生物信息学平台对分析结果进行可视化,结果见图1。
2.2 mRNA数据集的筛选
根据上述检索标准筛选出3个数据集,分别为GSE30529、GSE96804、GSE104954。其中GSE30529样本对照组为健康供肾者或非糖尿病肾活检样本,DKD 组为确诊DKD并排除了合并其他肾脏疾病患者的肾小球组织的样本;GSE96804样本对照组为肾肿瘤切除的非病变肾组织,DKD 组为2型糖尿病合并肾脏病变同时排除免疫性肾病和急性肾损伤的肾小球组织;GSE104954对照组为活体供肾者或健康肾组织,DKD组为DKD患者的肾间质组织,患者多伴有蛋白尿或典型的病理学改变。见表1。
2.3 mRNA数据集数据处理与整合
将 GSE30529、GSE96804 和 GSE104954 三个数据集合并,共获得8 214个DKD患者的mRNA表达数据。对数据进行标准化处理。校正前,不同数据集中样本间存在明显的分布差异(图2-A),经过校正处理后,样本分布在整体上趋于一致,各组数据之间具备较好的可比性(图2-B)。依据差异分析的筛选标准,设定调整后的P<0.05,且基因的表达倍数变化绝对值大于1,即logFC>1,在此条件下共识别出69个DEGs。其中包括38个上调基因,以及31个下调基因,见图3、图4。
2.4 DEGs的机器学习筛选结果
通过三种机器学习算法进行特征选择分析,LASSO回归模型筛选出38个核心mRNA,SVM-RFE模型确定28个核心mRNA,RF模型得到858个核心mRNA。将三种算法分别筛选得到的基因集合进行交集分析,最终识别出8个核心mRNA。见图5。
2.5 核心mRNA的表达和诊断效能分析
对筛选出的8个核心mRNA在DKD中的表达情况绘制小提琴图以进行可视化分析(图6)。其中C11orf 71、CYP27B1、DUSP1、LPL在DKD组中高表达, CASP3、MACF1、PIK3R3、 VIM在DKD组中低表达。ROC曲线显示,8个关键mRNA的AUC均>0.90(图7):C11orf 71(AUC=0.904),CASP3(AUC=0.909),CYP27B1(AUC=0.943),DUSP1(AUC=0.967),LPL(AUC=0.910),MACF1(AUC=0.910),PIK3R3(AUC=0.913),VIM(AUC=0.911)。
2.6 miRNA-mRNA调控网络的构建
基于ENCORI数据库,对8个核心mRNA的上游潜在靶向miRNA进行预测,共获得393个候选miRNA。利用Cytoscape 3.10.3软件中CytoHubba插件的MCC算法筛选出前10个关键miRNA,分别为miR-92a-3p、miR-495-3p、miR-25-3p、miR-32-5p、miR-137、miR-363-3p、miR-367-3p、miR-382-5p、miR-92b-3p、miR-1287-5p。将上述10个核心miRNAs与核心mRNAs构成miRNA-mRNA调控网络,结果见图8。
2.7 miRNA的功能富集注释及重叠通路分析
使用FunRich软件(3.1.3版本)对关键miRNA进行通路富集。结果表明,miRNA显著关联于转化生长因子-β(transforming growth factor-beta, TGF-β)受体信号通路、磷脂酰肌醇蛋白聚糖(glypican)通路、表皮生长因子受体1(epidermal growth factor receptor 1, ErbB1)下游信号通路、哺乳动物雷帕霉素靶蛋白(mammalian target of rapamycin,mTOR)信号通路、I类磷脂酰肌醇 3激酶(class I phosphoinositide 3-kinase,Class I PI3K)信号事件及其Akt介导途径、胰岛素信号通路、干扰素-γ(interferon-gamma,IFN-γ)通路、ErbB受体信号网络和肿瘤坏死因子相关凋亡诱导配体(tumor necrosis factor-related apoptosis-inducing ligand,TRAIL)信号通路等关键通路(图9)。
根据富集分析结果可得,这些miRNA所调控的信号通路与药物作用靶点所涉及的通路在功能上高度重合,主要集中在以PI3K/Akt为核心的信号通路上。
3 讨论
DKD是糖尿病常见且严重的慢性并发症,其发生发展受到炎症反应、氧化应激、代谢紊乱和纤维化等多因素共同影响[12],临床上尽管已有控制血糖、血压与蛋白尿的干预,但针对病理机制并能显著延缓进展的分子靶向策略仍有限。近年来,SGLT2抑制剂因其抑制肾小管的葡萄糖重吸收从而控制血糖水平的机制而受到广泛关注[13],越来越多证据表明其肾保护作用“超越降糖”,可能通过代谢重编程、抑制炎症与调节细胞自噬 /线粒体功能等多条途径发挥效应[14],但其明确的分子机制尚未完全阐明。本研究基于药物靶点预测、转录组分析、机器学习筛选与miRNA调控网络构建,从多组学层面整合揭示了恒格列净改善DKD的潜在作用机制。
本研究发现,恒格列净潜在靶点、DKD差异表达基因以及关键 miRNA 富集的通路高度集中于PI3K/Akt信号通路,说明恒格列净可能通过直接或间接调控PI3K/Akt信号通路核心分子。PI3K/Akt信号通路作为细胞内重要的信号转导途径,在DKD的发生发展中起到关键作用[15]。其通过PI3K激活Akt,参与调控细胞增殖、凋亡、代谢及炎症反应等多种生物过程来维持肾脏稳态,其异常激活或抑制均可导致肾脏细胞功能的紊乱,从而引发胰岛素抵抗,进一步加剧PI3K/Akt通路功能障碍,形成恶性循环[16]。研究[17]发现,恒格列净通过氧化应激和神经炎症的调节作用,间接恢复PI3K/Akt通路活性;同时可能通过调控miR-21-5p、miR-155-5p、miR-92a-3p等关键miRNA的表达,影响通路核心节点,从而调节肾小球及肾小管细胞的凋亡、自噬及纤维化进程[18]。
除了PI3K/Akt信号通路,本研究还提示FoxO和MAPK等信号通路可能在恒格列净干预DKD中发挥重要作用。FoxO家族转录因子在调控细胞凋亡、氧化应激和代谢稳态中起关键作用 [19],其活性可被PI3K/Akt通路负向调控[20]。恒格列净可能通过调控PI3K/Akt-FoxO轴,恢复FoxO活性,减轻氧化应激和细胞凋亡,从而发挥肾脏保护作用。另一方面,MAPK信号通路在炎症反应、纤维化及肾小球硬化中扮演核心角色,研究[21]表明其上游激活可通过多种刺激(如高糖、高脂)诱导肾脏细胞损伤。恒格列净可能通过间接调控MAPK通路及其交叉网络,抑制炎症反应和纤维化进程,从而协同PI3K/Akt通路发挥综合肾脏保护效应。这些结果提示,恒格列净可能通过多条信号通路的联动调控,实现对DKD的系统性干预。
在本研究所筛选出的8 个关键基因中,多个核心mRNA被证实与PI3K/Akt通路密切相关,提示该通路可能在恒格列净干预DKD的作用机制中发挥核心作用。其中,CASP3是经典的细胞凋亡执行蛋白, Yu 等[22]研究结果表明,CASP3 会放大炎症凋亡信号通路,可作为连接线粒体免疫串扰与DKD发病机制的关键生物标志物和治疗靶点。DUSP1是MAPK信号通路的负调控因子,研究[23]表明DKD患者中DUSP1表达显著降低,且与更严重的纤维化和更差的肾功能相关。LPL是脂质代谢的核心酶,已有研究[24]显示,LPL 相关的单核苷酸多态是导致 DKD 易感性的新候选因素,并可能促进中国2型糖尿病患者肾功能的减退。PIK3R3是PI3K/Akt信号通路的调节亚基之一,在胰岛素信号转导、细胞增殖和代谢中发挥重要作用,该基因在糖尿病及肾脏疾病中表达异常,且与胰岛素抵抗状态密切相关 [25]。VIM是间充质细胞的标志物,也是上皮间质转化(epithelial-mesenchymal transition,EMT)过程中的关键因素,其在多种上皮源性肿瘤中表达显著升高[26]。恒格列净已被证实可抑制部分EMT进程,表现出肾脏保护潜力。此外,MACF1、CYP27B1与C11orf71虽未直接定位于PI3K/Akt通路,但其在细胞骨架重塑等方面可能通过其他通路与PI3K/Akt交叉互作,参与调控肾脏病理进程[27]。这些结果提示,恒格列净可能通过多靶点调控PI3K/Akt为核心的信号网络,从而发挥其延缓DKD进展的综合作用。
本研究系统整合了网络药理学、转录组学、机器学习与miRNA预测分析结果,从网络层面及通路角度揭示了恒格列净干预DKD的特征。研究结果表明,恒格列净可能通过调控PI3K/Akt信号通路及其交叉网络,影响细胞增殖、凋亡、代谢及炎症反应等关键病理过程,从而实现肾脏保护作用。然而,本研究仍存在一些不足,筛选的关键基因和 miRNA 主要基于生物信息学分析和机器学习模型,仍需进一步通过细胞和动物实验加以验证。未来将结合更多临床样本和实验研究,从多角度进一步验证本研究的推测,并深入探讨恒格列净在 DKD 中的系统性调控机制。
利益冲突声明:作者声明本研究不存在任何经济或非经济利益冲突。
1. Peng QY, An Y, Jiang ZZ, et al. The role of immune cells in DKD: mechanisms and targeted therapies[J]. J Inflamm Res, 2024, 17: 2103-2118. DOI: 10.2147/JIR.S457526.
2. Barrera-Chimal J, Lima-Posada I, Bakris GL, et al. Mineralocorticoid receptor antagonists in diabetic kidney disease-mechanistic and therapeutic effects[J]. Nat Rev Nephrol, 2022, 18(1): 56-70. DOI: 10.1038/s41581-021-00490-8.
3. Mulder S, Hamidi H, Kretzler M, et al. An integrative systems biology approach for precision medicine in diabetic kidney disease[J]. Diabetes Obes Metab, 2018, 20 (Suppl 3): 6-13. DOI: 10.1111/dom.13416.
4. Fioretto P, Vettor R, Pontremoli R. SGLT2 inhibitors to prevent diabetic kidney disease[J]. Lancet Diabetes Endocrinol, 2024, 17: 2103-2118. DOI: 10.2147/JIR.S457526.
5. Armillotta M, Angeli F, Paolisso P, et al. Cardiovascular therapeutic targets of sodium-glucose co-transporter 2 (SGLT2) inhibitors beyond heart failure[J]. Pharmacol Ther, 2025, 270: 108861. DOI: 10.1016/j.pharmthera.2025.108861.
6. Tomita I, Kume S, Sugahara S, et al. SGLT2 Inhibition mediates protection from diabetic kidney disease by promoting ketone body-induced mTORC1 inhibition[J]. Cell Metab, 2020, 32(3): 404-419. DOI: 10.1016/j.cmet.2020.06.020.
7. Mima A. A narrative review of diabetic kidney disease: previous and current evidence-based therapeutic approaches[J]. Adv Ther, 2022, 39(8): 3488-3500. DOI: 10.1007/s12325-022-02223-0.
8. Votto M, De Silvestri A, Postiglione L, et al. Predicting paediatric asthma exacerbations with machine learning: a systematic review with Meta-analysis[J]. Eur Respir Rev, 2024, 33(174): 240118. DOI: 10.1183/16000617.0118-2024.
9. Lin J, Ma Q, Chen L, et al. Transcriptomic and miRNA signatures of ChAdOx1 nCoV-19 vaccine response using machine learning[J]. Life (Basel), 2025, 15(6): 981. DOI: 10.3390/life15060981.
10. Krisanapan P, Tangpanithandee S, Thongprayoon C, et al. Revolutionizing chronic kidney disease management with machine learning and artificial intelligence[J]. J Clin Med, 2023, 12(8): 3018. DOI: 10.3390/jcm12083018.
11. Li Y, Li X, Xu T, et al. Deciphering shared gene signatures and immune infiltration characteristics between gestational diabetes mellitus and preeclampsia by integrated bioinformatics analysis and machine learning[J]. Reprod Sci, 2025, 32(6): 1886-1904. DOI: 10.1007/s43032-025-01847-1.
12. Kato M, Natarajan R. Epigenetics and epigenomics in diabetic kidney disease and metabolic memory[J]. Nat Rev Nephrol, 2019, 15(6): 327-345. DOI: 10.1038/s41581-019-0135-6.
13. Neuen BL, Heerspink HJL, Vart P, et al. Estimated lifetime cardiovascular, kidney, and mortality benefits of combination treatment with SGLT2 inhibitors, GLP-1 receptor agonists, and nonsteroidal MRA compared with conventional care in patients with type 2 diabetes and albuminuria[J]. Circulation, 2024, 149(6): 450-462. DOI: 10.1161/CIRCULATIONAHA.123.067584.
14. Gajewska A, Wasiak J, Sapeda N, et al. SGLT2 inhibitors in kidney diseases-a narrative review[J]. Int J Mol Sci, 2024, 25(9): 4959. DOI: 10.3390/ijms25094959.
15. Yao L, Liang X, Liu Y, et al. Non-steroidal mineralocorticoid receptor antagonist finerenone ameliorates mitochondrial dysfunction via PI3K/Akt/eNOS signaling pathway in diabetic tubulopathy[J]. Redox Biol, 2023, 68: 102946. DOI: 10.1016/j.redox.2023.102946.
16. Huang X, Liu G, Guo J, et al. The PI3K/AKT pathway in obesity and type 2 diabetes[J]. Int J Biol Sci, 2018, 14(11): 1483-1496. DOI: 10.7150/ijbs.27173.
17. Abdelsalam RM, Hamam HW, Eissa NM, et al. Empagliflozin dampens doxorubicin-induced chemobrain in rats: the possible involvement of oxidative stress and PI3K/Akt/mTOR/NF-κB/TNF-α signaling pathways[J]. Mol Neurobiol, 2025, 62(3): 3480-3492. DOI: 10.1007/s12035-024-04499-5.
18. Shen Y, Cheng L, Xu M, et al. SGLT2 inhibitor empagliflozin downregulates miRNA-34a-5p and targets GREM2 to inactivate hepatic stellate cells and ameliorate non-alcoholic fatty liver disease-associated fibrosis[J]. Metabolism, 2023, 146: 155657. DOI: 10.1016/j.metabol.2023.155657.
19. Orea-Soufi A, Paik J, Bragança J, et al. FOXO transcription factors as therapeutic targets in human diseases[J]. Trends Pharmacol Sci, 2022, 43(12): 1070-1084. DOI: 10.1016/j.tips. 2022.09.010.
20. Lee J, Kim J, Lee JH, et al. SIRT1 promotes host protective immunity against toxoplasma gondii by controlling the FoxO-autophagy axis via the AMPK and PI3K/AKT signalling pathways[J]. Int J Mol Sci, 2022, 23(21): 13578. DOI: 10.3390/ijms232113578.
21. Livingston MJ, Zhang M, Kwon SH, et al. Autophagy activates EGR1 via MAPK/ERK to induce FGF2 in renal tubular cells for fibroblast activation and fibrosis during maladaptive kidney repair[J]. Autophagy, 2024, 20(5): 1032-1053. DOI: 10.1080/15548627.2023.2281156.
22. Yu X, Hu Y, Jiang W. Integrative analysis of mitochondrial and immune pathways in diabetic kidney disease: identification of AASS and CASP3 as key predictors and therapeutic targets[J]. Ren Fail, 2025, 47(1): 2465811. DOI: 10.1080/0886022X. 2025.2465811.
23. Liu Z, Hu H, Jin Y, et al. Artesunate enhances DUSP1-dependent mitochondrial integrity to mitigate renal fibrosis in diabetic kidney disease[J]. Phytother Res, 2025, 39(11): 5085-5101. DOI: 10.1002/ptr.70091.
24. Wu Y, Cheng S, Gu H, et al. Variants within the LPL gene confer susceptility to diabetic kidney disease and rapid decline in kidney function in Chinese patients with type 2 diabetes[J]. Diabetes Obes Metab, 2023, 25(10): 3012-3019. DOI: 10.1111/dom.15199.
25. Perlis ML, Posner D, Riemann D, et al. Insomnia[J]. Lancet, 2022, 400(10357): 1047-1060. DOI: 10.1016/S0140-6736(22)00879-0.
26. 龚豪. 单细胞RNA测序结合机器学习算法揭示肾透明细胞癌新型生物标志物ENO2、VIM及其表达水平的验证[D]. 太原: 山西医科大学, 2023. DOI: 10.27288/d.cnki.gsxyu.2023.000418.
27. Dobyns WB, Aldinger KA, Ishak GE, et al. MACF1 mutations encoding highly conserved zinc-binding residues of the GAR domain cause defects in neuronal migration and axon guidance[J]. Am J Hum Genet, 2018, 103(6): 1009-1021. DOI: 10.1016/j.ajhg. 2018.10.019.