CardioAtlas:解析心血管组织与疾病的单细胞转录组图谱-文献解析

1. 领域背景与文献引入

文献英文标题:CardioAtlas: deciphering the single-cell transcriptome landscape in cardiovascular tissues and diseases;发表期刊:Biomarker Research;影响因子:未公开;研究领域:心血管疾病单细胞转录组学。

心血管疾病是全球范围内导致发病与死亡的首要原因,解析其细胞组成与微生态是理解疾病进展的关键。单细胞RNA测序(scRNA-seq)技术的应用,极大深化了人类对心血管系统发育过程及疾病潜在机制的认知——它揭示了心血管组织中多种细胞类型(如心肌细胞、内皮细胞、成纤维细胞)的状态异质性,为疾病机制研究提供了高精度视角。然而,现有心血管scRNA-seq数据集分散于各类文献中,缺乏针对心血管系统与疾病的整合型单细胞资源:尽管早期有CVDHD等心血管数据资源,但该资源构建于十年前,未聚焦单细胞转录组数据,无法满足当前研究需求。在此背景下,本研究旨在构建一个全面、系统化的心血管单细胞转录组资源CardioAtlas,整合多物种、多疾病类型的scRNA-seq数据,提供标准化分析模块,解决数据集分散、分析流程复杂的问题。

2. 文献综述解析

文献综述以“scRNA-seq在心血管研究中的价值”与“现有资源的局限性”为核心逻辑,梳理领域研究脉络。现有研究的关键结论显示,scRNA-seq技术通过解析单个细胞的转录组信息,明确了心血管疾病中细胞类型的异质性(如成纤维细胞的亚型分化)及细胞状态的动态变化,为疾病机制研究提供了新视角。但现有研究的局限性在于:大量scRNA-seq数据集分散于不同文献,缺乏统一的注释与整合;已有的心血管数据资源(如CVDHD)未针对单细胞数据设计,且数据更新滞后。

本研究的创新价值在于填补了这一空白——首次构建了针对心血管组织与疾病的综合scRNA-seq资源CardioAtlas,整合人类(27个数据集,>192.9万细胞)与小鼠(39个数据集,>108.8万细胞)的大规模数据,通过手动注释构建参考图谱,并开发细胞类型预测、功能富集等5个分析模块,支持用户上传数据进行个性化分析,为心血管单细胞研究提供了“一站式”资源。

3. 研究思路总结与详细解析

本研究以“整合分散数据→构建参考图谱→开发分析工具→验证应用价值”为核心逻辑,实现心血管单细胞资源的系统化构建。研究目标是建立涵盖人类与小鼠的心血管scRNA-seq参考图谱及分析平台,解决现有数据集分散、分析流程复杂的问题;核心科学问题是如何整合多物种、多疾病的scRNA-seq数据,为用户提供便捷的分析功能;技术路线遵循“数据收集→注释→建库→工具开发→验证”的闭环。

3.1 数据收集与参考图谱构建

实验目的是整合多物种心血管系统与疾病的scRNA-seq数据,构建参考图谱。方法为通过大规模文献检索,收集人类(27个数据集,覆盖心血管系统与疾病)与小鼠(39个数据集)的scRNA-seq数据,总细胞量分别超过192.9万与108.8万;随后通过手动注释,明确细胞类型(人类43种、小鼠39种),最终构建人类12个、小鼠15个scRNA-seq参考图谱。结果显示,参考图谱覆盖了常见心血管组织(如心脏、血管)与疾病(如肥厚型心肌病)的细胞类型,为后续分析提供了基础(图1)。

figure 1

实验所用关键产品:文献未提及具体实验产品,领域常规使用scRNA-seq建库试剂盒(如10x Genomics Chromium Single Cell 3’ Kit)、测序平台(如Illumina NovaSeq 6000)及注释工具(如Seurat)。

3.2 分析模块开发

实验目的是为用户提供多样化的单细胞转录组分析功能。方法是基于构建的参考图谱,开发5个分析模块:细胞类型预测(利用参考图谱注释用户数据的细胞类型)、标记基因识别(识别特定细胞类型的特征基因)、功能富集分析(分析基因的生物学功能)、细胞类型特异性转录调控子识别(解析转录因子的调控网络)及细胞间通讯分析(预测细胞间的 ligand-receptor 相互作用);同时支持用户上传自身scRNA-seq数据进行个性化分析。结果是CardioAtlas平台具备多维度分析能力,降低了单细胞分析的技术门槛。

3.3 案例验证与应用示范

实验目的是验证CardioAtlas的准确性与应用价值。方法是选取人类肥厚型心肌病(HCM)及小鼠心血管疾病的独立scRNA-seq数据集,利用CardioAtlas进行细胞类型注释、标记基因验证、功能富集及细胞间通讯分析。结果显示,HCM数据集的细胞类型注释整体准确性达0.945(图2A-B);标记基因分析发现成纤维细胞(FB)的特征基因POSTN、COL22A1、DCN显著高表达(与已有研究一致,图2C);功能富集分析显示FB细胞的高表达基因富集于神经发生通路(符合先前研究结论,图2D);细胞间通讯分析发现THBS4-CD36相互作用介导肌成纤维细胞与周细胞、心肌母细胞等的通讯(图2E),提示其可能为HCM的潜在治疗靶点。小鼠数据集的验证显示细胞类型注释准确性达0.922,标记基因(如心肌细胞的Ttn、成纤维细胞的Pdgfra)与已有研究一致,功能富集分析显示免疫细胞的高表达基因富集于免疫应答通路,细胞间通讯分析发现Cd74-App相互作用介导巨噬细胞与其他细胞的通讯。

figure 2

实验所用关键产品:文献未提及具体实验产品,领域常规使用细胞类型注释工具(如SingleR)、功能富集工具(如ClusterProfiler)及细胞间通讯分析工具(如CellChat)。

4. Biomarker研究及发现成果解析

本研究涉及的Biomarker主要为心血管细胞类型的特征标记基因(如人类成纤维细胞的POSTN、COL22A1、DCN,小鼠心肌细胞的Ttn、成纤维细胞的Pdgfra)及细胞间通讯的ligand-receptor对(如THBS4-CD36、Cd74-App)。筛选/验证逻辑为:基于CardioAtlas的标记基因识别模块,结合已有研究(如POSTN是已知的成纤维细胞标记基因)进行验证;细胞间通讯对通过平台的细胞间通讯分析模块预测,结合功能富集结果验证。

研究过程中,标记基因的来源为整合的scRNA-seq数据集(人类与小鼠的心血管组织/疾病样本),验证方法为基因表达水平分析(热图展示);细胞间通讯对的来源为细胞类型注释后的数据集,验证方法为ligand-receptor相互作用预测。特异性与敏感性数据方面,HCM数据集的细胞类型注释准确性达0.945(文献未明确样本量),小鼠数据集达0.922(文献未明确样本量);标记基因POSTN等在FB细胞中显著高表达(文献提及“significantly overexpressed”,但未提供具体P值);功能富集分析的显著通路标注*p < 0.05(文献未明确样本量)。

核心成果包括:(1)明确了心血管常见细胞类型的特征标记基因(如人类FB的POSTN、COL22A1、DCN,小鼠CM的Ttn),可作为细胞类型注释的Biomarker;(2)发现THBS4-CD36等细胞间通讯对,提示其可能参与HCM的发病机制,为潜在治疗靶点;(3)验证了CardioAtlas作为Biomarker研究工具的价值,能够准确识别细胞类型特征基因及调控通路。其中,THBS4-CD36相互作用的创新性在于首次在HCM数据集中揭示其介导的细胞间通讯,为HCM的机制研究提供了新方向;标记基因的功能关联为细胞类型的准确注释提供了依据(如POSTN作为FB的Biomarker,支持其在纤维化中的作用)。

特别声明

1、本页面内容包含部分的内容是基于公开信息的合理引用;引用内容仅为补充信息,不代表本站立场。

2、若认为本页面引用内容涉及侵权,请及时与本站联系,我们将第一时间处理。

3、其他媒体/个人如需使用本页面原创内容,需注明“来源:[生知库]”并获得授权;使用引用内容的,需自行联系原作者获得许可。

4、投稿及合作请联系:info@biocloudy.com。