中国科学技术大学翁建平/徐索文团队基于多个公共数据库为脂质代谢调控靶点与心血管疾病之间的复杂关系提供了一个全面的评价。通过确定致病基因、治疗靶点和开发预测机器学习模型,对CVD的预防和治疗提供了潜在的策略。该研究以题为“Prioritization of Lipid MetabolismTargets for the Diagnosis and Treatmentof Cardiovascular Diseases”发表在Research上。
Citation: Wang Z, Chen S, Zhang F, Akhmedov S, Weng J, Xu S. Prioritization of Lipid Metabolism Targets for the Diagnosis and Treatment of Cardiovascular Diseases. Research 2025; 8: Article 0618.
https://doi.org/10.34133/ research.0618
研究背景
心血管疾病(CVD)仍然是全球发病率和死亡率的主要原因,给全世界社会造成了巨大的健康负担。CVD与脂质代谢之间的复杂关系已被充分证明,许多研究强调了脂代谢紊乱在CVD发病机制中的关键作用。然而,脂质代谢的调节是一个复杂的过程,涉及大量基因,每个基因都具有不同的功能,并且经常重叠。阐明这些基因与CVD结果之间的因果关系对于发现潜在的治疗靶点和设计有效的治疗方法至关重要。
尽管人们对脂质代谢及其与CVD的关系的理解取得了重大进展,但缺乏对CVD背景下脂质代谢相关基因的系统和全面评估。传统方法主要集中在单基因研究上,可能忽略了多基因之间复杂的交互作用及其对疾病发展的贡献。因此,迫切需要一种多维度的方法来系统评估脂质代谢相关基因在心血管疾病中的作用。
研究进展
翁建平/徐索文研究团队旨在通过使用基于全基因组关联研究(GWAS)的因果推理方法对881个脂质代谢相关基因进行全面评估来填补这一空白。孟德尔随机化(MR)和共定位分析确定与CVD发生和发展有因果关系的基因,并在独立队列中验证这些发现。再通过全表型关联研究(PheWAS)和药物靶点-药物关联数据库进行反向筛选来确定潜在的治疗靶点。最后,整合血清蛋白质组学数据,建立CVD预测的机器学习模型,旨在为疾病诊断和预后提供新的工具。这些发现不仅为CVD的发病机制提供了新的见解,而且为开发靶向治疗和改进诊断策略奠定了基础。
图1 心血管疾病诊断和治疗中脂代谢靶点优先级分析的研究设计。
通过MR和共定位分析鉴定54个与CVD相关的脂质代谢调节基因
该研究通过对609个基因关联的25115个数量性状位点(QTLs)与2个心血管疾病GWAS队列(ebi-a-GCST90086053,n=56,637;finn-b-I9_CVD,n=218,792)进行孟德尔随机化和共定位分析,并在2个外部CVD队列进行验证(ebi-a-GCST90038595,n=484,598;ebi-a-GCST90029019,n=477,807),最终筛选出54个与CVD相关的脂代谢相关基因。
图2 肝脂代谢调节靶点与心血管疾病之间风险联系的MR和共定位分析
通过PheWAS和药靶-药物关联数据库反向筛选确定29个CVD优选治疗靶点
为了评估优先药靶的“新颖性”和“潜力”,该研究开发了一个评分系统。该系统包括6个标准:(1) CVD 的孟德尔随机化分析中有显著性的基因,OR≥1.05或≤0.95,P≤0.01;(2)在CVD共定位分析中发现的显著基因,PH4值为> 0.8;(3) PubMed文献综述报道过的基因;(4)在心血管疾病或相关并发症中表现出重要意义的基因;(5)与CVD或并发症相关表型的基因, P < 5 × 10−8;(6) 在DrugBank、ChEMBL和The Human Protein Atlas等数据库中标注为治疗靶点的基因。达到以上4个或更多标准的靶点被归类为高潜力,而未达到这一门槛的目标被认为是相对新颖和研究不足的。最终经过以上标准优选到29个CVD治疗靶点。
图3 基于pheWAS和药靶-药物数据框反向筛选鉴定CVD潜在药靶。
13个潜在药靶和对应药物用于CVD的治疗
尽管脂代谢相关靶点在CVD治疗中研究最多,但直接应用于CVD治疗的靶标数量仍然有限。该研究利用复杂的多表型MR分析,严格检查了13个候选基因与CVD及其13个相关并发症(心房颤动, n=537,409; 冠状动脉粥样硬化, n=537,409; 361,194; 冠状动脉疾病, n=352,063; 高密度脂蛋白胆固醇, n=403,943; 低密度脂蛋白胆固醇, n=201,678; 总胆固醇, n=344,278; 总甘油三酯, n=115,082; 心力衰竭, n=977,323; 高脂血, n=349,222; 高血压, n=484,598; 缺血性中风, n=484,121; 心肌梗死, n=484,598; 周围血管疾病, n=463,010)之间的关系。研究结果表明这13个基因不仅在CVD中表型强相关性,而且与多个并发症相关,这预示着他们作为CVD治疗靶标的潜力。同时我们也在多个药靶数据库中筛选到他们对应的靶向药物,这为CVD的精准治疗提供了参考。
图4 13个药靶与CVD及其并发症的关系及潜在靶向治疗药物。
基于5个蛋白的机器学习模型用于CVD的诊断预测
除了探索候选靶点的治疗潜力外,该研究还尝试分析它们潜在的疾病预测能力。基于血清蛋白组数据,应用XGBoost机器学习技术构建预测模型,并使用SHAP来解释分析结果。最终确定由5个蛋白组成的机器学习预测模型用于CVD的诊断预测。该预测模型在实验队列和预测队列均表现很高的预测准确度,提示其在预测CVD方面的应用前景,这为CVD的精确诊断提供了潜在新策略。
图5 基于5个蛋白的机器学习预测模型。
未来展望
总而言之,该研究全面揭示了脂代谢调控靶点与CVD之间的复杂关系,并提示了潜在的治疗靶点和治疗药物。此外,本研究开发的机器学习模型为CVD的诊断和预测提供了一个有前途的工具,为未来的研究和临床应用提供了指引。
图6 文章摘要图。
该工作得到了科技部重点研发项目,国家自然科学基金,中国科大附一院创新攻关团队项目等资助,以及代谢健康与泛血管病安徽省重点实验室的大力支持。中国科学技术大学生命科学与医学部特任副研究员汪志华为第一作者,翁建平教授与徐索文研究员为本论文的共同通讯作者。
作者简介
翁建平,中国科学技术大学讲席教授,中国医学科学院学术咨询委员会学部委员,代谢健康与泛血管病安徽省重点实验室主任,现任安徽医科大学校长。长期从事糖尿病、代谢性肝病与泛血管疾病的临床与应用基础研究。以通讯作者在Lancet、BMJ、JCI、Nat Cardiovasc Res、Sci Adv等国际期刊发表SCI论文300余篇,连续多年入选“爱思唯尔中国高被引学者(临床医学)”。学术成果被多项国际/国内指南/共识引用。主持国家重点研发计划项目(2017年)、科技创新2030项目(2024年)等。
徐索文,中国科学技术大学生命科学与医学部研究员、博士生导师。长期专注于动脉粥样硬化性心血管疾病的发病机理研究,以通讯作者(含共同)在Nat Cardiovasc Res、Sci Adv、Nat Commu、J Clin Invest、Research等期刊发表论文。主持美国心脏协会基金、国家自然科学基金等多项基金。曾获美国心脏协会(AHA)Career Development Award(2018年)和德国洪堡资深学者(2023)。
往期回顾
18
03-2025
12
03-2025
Research|在保护患者隐私的前提下实现安全的医疗数据共享—上海交通大学医学院附属瑞金医院周建桥团队乳腺超声图像合成研究
添加编辑微信 | 加入科学家社群
和Research主编面对面
验证请写明 姓名+单位哦