中文|English

优先出版

基于加权基因共表达网络分析和机器学习方法探究葡萄糖代谢参与缺血性脑卒中的机制及其关键基因

来源: 作者: 发布时间:2024-03-06

王曼曼1,2,宁文华1,王海明1,刘伊滢1,李思颖1,2,高京1,2,魏向阳1
作者单位:1.450052河南省郑州市,郑州大学第一附属医院康复医学科 2.450052河南省郑州市,郑州大学医学科学院
通信作者:魏向阳,E-mail:weixiangyang1022@126.com

【摘要】 目的 基于加权基因共表达网络分析(WGCNA)和机器学习方法探究葡萄糖代谢参与缺血性脑卒中(IS)的机制及其关键基因。方法 本实验时间为2022年11月—2023年6月。从GEO数据库GPL6883平台下载IS芯片数据集GSE16561,其包括39例IS患者(IS组)和24例健康受试者(对照组)外周血的总RNA表达谱数据,对其进行预处理,基于WGCNA筛选与IS组相关性最强的模块内基因,将其与在GeneCards数据库选取的相关性得分>5分的基因取交集,得到葡萄糖代谢相关基因并对其进行基因本体论(GO)功能富集分析。基于蛋白质相互作用(PPI)网络分析,采用机器学习方法〔随机森林(RF)、支持向量机递归特征消除(SVM-RFE)算法〕筛选葡萄糖代谢关键基因。比较GSE16561中IS组和对照组葡萄糖代谢关键基因表达量,同时绘制葡萄糖代谢关键基因诊断IS的ROC曲线,通过曲线下面积(AUC)评估其诊断效能。结果 WGCNA共得到了11个基因共表达模块,其中棕色模块与IS组相关性最强(r=0.56,P=2×10-6),其共包含461个基因。GeneCards数据库中相关性得分>5分的基因共2 386个,将其与棕色模块基因取交集,共得到85个葡萄糖代谢相关基因。GO功能富集分析结果显示,葡萄糖代谢相关基因主要涉及的生物学过程(BP)为对肽的反应、对肽激素的反应、细胞碳水化合物代谢过程,主要涉及的细胞成分(CC)为富含纤维胶凝蛋白1的颗粒、分泌颗粒腔、细胞质囊泡腔,主要涉及的分子功能(MF)为类泛素蛋白连接酶结合、磷蛋白结合、蛋白酶结合。PPI网络分析结果显示,得到了1个包含12个基因的核心模块。RF算法分析结果显示,重要性排名前12位的基因分别为MMP9、STAT3、ITGAM、NFKB1、TLR2、MYD88、STAT5A、TLR4、SYK、LYN、CEBPB、MAPK3。SVM-RFE算法分析结果显示,得到4个关键基因,分别为MMP9、STAT3、ITGAM、TLR2。将RF算法以及SVM-RFE算法得到的关键基因取交集,最终得到4个葡萄糖代谢关键基因,分别为MMP9、STAT3、ITGAM、TLR2。IS组MMP9、STAT3、ITGAM、TLR2表达量高于对照组(P<0.05)。ROC曲线分析结果显示,MMP9、STAT3、ITGAM、TLR2诊断IS的AUC分别为0.855〔95%CI(0.762~0.948)〕、0.872〔95%CI(0.784~0.960)〕、0.842〔95%CI(0.747~0.936)〕、0.829〔95%CI(0.727~0.931)〕。结论 葡萄糖代谢相关基因主要通过影响炎症反应及氧化应激等而参与IS的发生发展,且MMP9、STAT3、ITGAM、TLR2为葡萄糖代谢关键基因,这可为葡萄糖代谢参与IS的相关研究提供新思路。
【关键词】 缺血性卒中;葡萄糖代谢;加权基因共表达网络分析;机器学习;关键基因
【中图分类号】 R 743.3 【文献标识码】 A DOI:10.12114/j.issn.1008-5971.2024.00.077