Resolving clonal evolution and selection of extrachromosomal DNA at single-cell resolution
以单细胞分辨率解析克隆进化和染色体外DNA的选择
| 期刊: | Genome Biology | 影响因子: | 9.400 |
| 时间: | 2026 | 起止号: | 2026 Jan 29;27(1):10 |
| doi: | 10.1186/s13059-026-03933-2 | 研究方向: | 细胞生物学 |
文献解析
1. 领域背景与文献
文献英文标题:ecSingle: detection of oncogene-containing extrachromosomal DNA from single-cell RNA-sequencing data;发表期刊:Genome Biology;影响因子:17.906;研究领域:肿瘤基因组学、单细胞组学
染色体外DNA(ecDNA)是肿瘤基因组的核心特征之一,携带癌基因的ecDNA可通过有丝分裂时的不均等分裂实现拷贝数动态调控,帮助肿瘤细胞快速响应治疗压力与微环境选择,与肿瘤恶性进展、治疗耐药密切相关。领域发展关键节点:早期通过bulk全基因组测序发现ecDNA在肿瘤中的广泛存在,后续单细胞基因组技术(如scEC&T-seq、scCircle-seq)实现了单细胞水平ecDNA检测,但这类方法需要对单细胞进行物理分离与DNA扩增,操作繁琐且样本消耗量大,无法适配已积累的海量单细胞RNA测序(scRNA-seq)数据集。当前研究热点聚焦于ecDNA的肿瘤内异质性、克隆演化模式及与肿瘤细胞转录状态的调控关联,未解决的核心问题是缺乏高效兼容常规scRNA-seq数据的单细胞ecDNA检测工具,限制了对ecDNA演化机制的大规模研究。
针对现有单细胞ecDNA检测方法依赖特殊样本处理、无法利用已有的scRNA-seq数据的局限,本研究开发了整合等位基因失衡与异常表达特征的计算方法ecSingle,无需额外样本处理即可直接从常规scRNA-seq数据中检测携带癌基因的ecDNA,为解析肿瘤内ecDNA异质性、克隆演化及转录调控机制提供了高效工具,具有重要的基础研究与临床转化价值。
2. 文献综述解析
作者对领域内现有研究的分类维度为技术实现路径,分为基于bulk基因组测序的ecDNA检测方法、基于单细胞基因组的ecDNA检测方法及基于scRNA-seq的间接分析方法三类。
基于bulk基因组测序的方法(如AmpliconArchitect)可精准解析ecDNA的结构特征,但仅能反映肿瘤细胞群体的平均状态,无法解析单细胞水平的ecDNA异质性;基于单细胞基因组的方法(如scEC&T-seq、scCircle-seq)可实现单细胞水平ecDNA检测,但需要对单细胞进行DNA分离与扩增,操作复杂度高、样本需求量大,难以应用于已有的大量scRNA-seq数据集;基于scRNA-seq的间接分析方法多聚焦于基因表达异常变化,无法区分ecDNA与染色体扩增(如均一染色区HSR)导致的表达差异,难以精准识别ecDNA。现有研究的局限性在于缺乏可高效利用常规scRNA-seq数据的单细胞ecDNA检测工具,限制了对ecDNA肿瘤内异质性及演化机制的大规模研究。
本研究首次开发了整合等位基因失衡(AI)和异常表达(OE)的计算方法ecSingle,无需特殊样本处理即可直接从常规scRNA-seq数据中检测携带癌基因的ecDNA,同时通过表达方差异常指标可有效区分ecDNA与染色体扩增,填补了现有方法无法高效利用scRNA-seq数据解析单细胞水平ecDNA的空白;此外,ecSingle还可解析ecDNA的肿瘤内异质性、克隆演化及与肿瘤细胞转录状态的关联,为ecDNA的功能研究提供了新的技术范式。
3. 研究思路总结与详细解析
本研究的整体框架为“方法开发→多维度验证→性能优化→功能拓展”,研究目标是开发并验证一种基于scRNA-seq数据的单细胞ecDNA检测方法ecSingle,核心科学问题是如何通过转录组数据中的等位基因失衡与异常表达特征精准识别ecDNA并区分其与染色体扩增,技术路线遵循“方法原理构建→细胞系基准测试→临床样本验证→长读长测序优化→单细胞异质性与演化分析”的闭环逻辑。
3.1 ecSingle方法开发与原理验证
实验目的:构建整合等位基因失衡与异常表达特征的计算方法,实现从scRNA-seq数据中检测ecDNA,并区分不同类型的基因组与转录异常。
方法细节:首先对scRNA-seq数据进行严格质量控制,包括去除低质量细胞、双细胞及环境RNA污染,同时过滤纯合SNP与低覆盖度SNP;随后通过SNP堆积分析计算每个细胞中SNP位点的B等位基因频率(BAF),结合细胞聚类获得稳健的BAF估计以识别等位基因失衡片段;通过肿瘤特异性差异表达分析识别异常表达基因;最后整合等位基因失衡与异常表达特征,同时引入表达方差异常指标(欧氏距离)区分ecDNA与染色体扩增,将细胞分为正常细胞、杂合性缺失(LOH)细胞、转录上调细胞及ecDNA扩增细胞四类。
结果解读:方法流程示意图清晰展示了ecSingle从scRNA-seq数据中识别ecDNA的完整步骤,验证了该方法可同时识别ecDNA、LOH、转录上调等多种基因组与转录异常类型,为后续验证与应用奠定了基础。
产品关联:文献未提及具体实验产品,领域常规使用单细胞测序文库构建试剂盒(如10x Genomics Chromium系列)、生物信息学分析软件(如Cell Ranger、Seurat)等。
3.2 细胞系基准测试验证ecSingle性能
实验目的:在已知ecDNA与染色体扩增的细胞系中验证ecSingle的检测性能,明确其区分ecDNA与染色体扩增的能力。
方法细节:使用同一患者来源的结肠癌细胞系COLO320DM(MYC位于ecDNA上)与COLO320HSR(MYC位于染色体HSR上),通过ecSingle分析其scRNA-seq数据,计算等位基因失衡、异常表达及表达方差异常指标(欧氏距离),比较两种细胞系中MYC所在区域的BAF、表达水平及表达方差差异。
结果解读:COLO320DM细胞中MYC区域的异常表达水平显著高于COLO320HSR细胞,且表达方差更大,反映了ecDNA不均等分裂导致的单细胞异质性;基因组水平上,ecSingle识别的MYC区域欧氏距离为0.63,远高于其他区域的0.06(P<0.01,Wilcoxon秩和检验),验证了ecSingle可有效区分ecDNA与染色体扩增,且能捕捉ecDNA的异质性特征。
产品关联:文献未提及具体实验产品,领域常规使用细胞培养试剂、单细胞测序平台等。
3.3 临床样本验证ecSingle检测准确性
实验目的:在临床肿瘤样本中验证ecSingle检测ecDNA的准确性,并扩展至不同肿瘤类型。
方法细节:对胶质母细胞瘤(CE34、CE65、CE26)与髓母细胞瘤(801、MB019)患者的scRNA-seq数据进行ecSingle分析,识别携带癌基因的ecDNA片段;通过全基因组测序(WGS)结合AmpliconArchitect工具对ecSingle的检测结果进行验证;同时分析不同肿瘤类型中ecDNA的特征。
结果解读:在胶质母细胞瘤样本CE34中,ecSingle识别到携带EGFR的ecDNA片段,与WGS检测结果高度一致,断点差异小于800 Kb;在髓母细胞瘤样本801与MB019中,ecSingle成功识别到携带MYCN的ecDNA片段;在胶质母细胞瘤样本CE65中,识别到携带PDGFRA与NFIB的ecDNA片段,验证了ecSingle在不同肿瘤类型中检测ecDNA的准确性与通用性,且CE34样本中ecDNA区域的10个基因在肿瘤细胞中显著上调(二项式检验,P<0.01)。
产品关联:文献未提及具体实验产品,领域常规使用临床样本处理试剂、全基因组测序平台、生物信息学分析工具(如AmpliconArchitect)等。
3.4 长读长测序优化ecSingle检测性能
实验目的:评估长读长测序对ecSingle检测ecDNA性能的提升作用,明确读长与测序深度对检测效果的影响。
方法细节:对胶质母细胞瘤样本CE26进行Oxford Nanopore Technologies(ONT)长读长scRNA-seq测序,同时进行WGS验证;比较短读长(91 bp)、中读长(293 bp)与长读长(中位1144 bp)测序数据中informative SNP的数量,通过多项式回归分析读长与测序深度对informative SNP数量的影响。
结果解读:长读长测序数据中informative SNP的数量显著高于短读长与中读长测序,在相同测序深度下,长读长测序可获得10.9倍于短读长的转录覆盖度;ecSingle基于长读长数据检测的ecDNA片段与WGS结果高度一致,验证了长读长测序可显著提升ecSingle的检测性能,尤其是在复杂基因组区域。
产品关联:实验所用关键产品:Oxford Nanopore Technologies的长读长测序平台、10x Genomics Chromium Next GEM Single Cell 3"文库构建试剂盒。
3.5 单细胞水平解析ecDNA的肿瘤内异质性与克隆演化
实验目的:解析ecDNA的肿瘤内异质性、克隆演化模式及与肿瘤细胞转录状态的关联。
方法细节:对胶质母细胞瘤样本SF11247与NVB33(包含原发与复发样本)的scRNA-seq数据进行ecSingle分析,结合基因组聚类(InferCNV)与转录聚类(Leiden)识别肿瘤亚克隆;分析不同亚克隆中ecDNA的存在状态、表达特征及与转录细胞状态的关联;比较原发与复发样本中ecDNA的克隆演化模式。
结果解读:在SF11247中,亚克隆2携带EGFR的ecDNA,且该亚克隆以星形胶质细胞样(AC-like)和间充质样(MES-like)细胞状态为主,而亚克隆1无ecDNA,以少突胶质细胞前体细胞样(OPC-like)和AC-like细胞状态为主,提示ecDNA与肿瘤细胞转录状态密切相关;在NVB33中,原发样本中占比小的ecDNA阳性亚克隆在复发样本中成为优势克隆,且复发样本中ecDNA的拷贝数有所降低,提示ecDNA阳性克隆的克隆选择与肿瘤复发相关,且治疗压力可导致ecDNA拷贝数下调。
产品关联:文献未提及具体实验产品,领域常规使用生物信息学分析工具(如InferCNV、Leiden聚类算法)等。
4. Biomarker研究及发现成果解析
本研究聚焦于携带癌基因的ecDNA作为肿瘤Biomarker的特征与功能,通过完整的筛选、验证与分析链条,明确了该类Biomarker与肿瘤异质性、克隆演化及临床预后的关联。
Biomarker定位:本研究中涉及的Biomarker为携带癌基因的ecDNA(包括EGFR-ecDNA、MYCN-ecDNA、PDGFRA-ecDNA等),属于基因组结构变异类Biomarker;筛选与验证逻辑为“基于scRNA-seq数据的等位基因失衡+异常表达特征初筛→细胞系验证检测特异性→临床样本WGS验证存在真实性→单细胞水平解析异质性与演化特征”的完整闭环。
研究过程详述:该类Biomarker来源于胶质母细胞瘤、髓母细胞瘤等临床肿瘤样本的单细胞RNA测序数据;验证方法包括全基因组测序结合AmpliconArchitect工具验证ecDNA的结构真实性,通过表达方差异常指标区分ecDNA与染色体扩增;特异性方面,ecSingle可精准识别携带癌基因的ecDNA片段,与WGS检测结果的一致性高(如CE34样本中ecSingle识别的EGFR-ecDNA片段与WGS结果的断点差异小于800 Kb);敏感性方面,ecSingle可检测到临床样本中占比极低的ecDNA阳性亚克隆(如NVB33原发样本中占比小的ecDNA阳性亚克隆);统计学结果显示,COLO320DM细胞中ecDNA区域的欧氏距离显著高于其他区域(P<0.01,Wilcoxon秩和检验),CE34样本中ecDNA区域的10个基因在肿瘤细胞中显著上调(二项式检验,P<0.01)。
核心成果提炼:该类ecDNA Biomarker与肿瘤细胞的恶性表型、转录状态及克隆演化密切相关,如EGFR-ecDNA阳性的胶质母细胞瘤亚克隆以AC-like和MES-like细胞状态为主,且可在治疗压力下成为优势克隆驱动肿瘤复发;创新性在于首次实现了从常规scRNA-seq数据中检测单细胞水平的ecDNA Biomarker,为肿瘤的预后评估、耐药机制研究提供了新的工具;此外,该类Biomarker的异质性特征提示其可作为肿瘤精准治疗的潜在靶点,为ecDNA的临床转化应用奠定了基础。
特别声明
1、本页面内容包含部分的内容是基于公开信息的合理引用;引用内容仅为补充信息,不代表本站立场。
2、若认为本页面引用内容涉及侵权,请及时与本站联系,我们将第一时间处理。
3、其他媒体/个人如需使用本页面原创内容,需注明“来源:[生知库]”并获得授权;使用引用内容的,需自行联系原作者获得许可。
4、投稿及合作请联系:info@biocloudy.com。