FibroBox:一种预测HBV感染患者显著肝纤维化和肝硬化的新型非侵入性工具-文献解析

1. 领域背景与文献引入

文献英文标题:FibroBox: a novel noninvasive tool for predicting significant liver fibrosis and cirrhosis in HBV infected patients;发表期刊:Biomarker Research;影响因子:未公开;研究领域:慢性乙型肝炎(CHB)相关肝纤维化非侵入性诊断。

慢性乙型肝炎(CHB)是全球公共卫生问题,中国更是高流行区——约7400万人群为乙型肝炎表面抗原(HBsAg)阳性,占全球感染人数的1/3。肝纤维化是CHB进展为肝硬化、肝细胞癌(HCC)的关键中间阶段,早期准确分期对指导抗病毒治疗、改善预后至关重要。传统肝活检是肝纤维化分期的“金标准”,但存在有创性、采样误差(约10%-20%)、患者依从性低等局限。

为解决这一问题,非侵入性诊断方法应运而生,主要分为两类:血清生物标志物(如AST与血小板比值指数(APRI)、纤维化-4指数(FIB-4))和弹性成像技术(如瞬时弹性成像(TE,商品名Fibroscan))。血清标志物的优势是检测简便、成本低,但仅基于少数血清参数,无法捕捉肝纤维化的复杂病理过程,准确性不足(AUROC多在0.6-0.7);TE通过测量肝硬度直接反映纤维化程度,准确性较高(AUROC约0.8-0.9),但设备成本高(约34000欧元/台)、受患者体重指数(BMI≥30kg/m²)和腹水影响,且在中文CHB队列中的准确性仍未达到临床需求。

针对现有方法的不足,本研究旨在开发一种结合机器学习、TE结果、血清生物标志物和超声参数的新型非侵入性模型(FibroBox),提高中文CHB患者肝纤维化(显著纤维化:F≥2;肝硬化:F4)的预测准确性,为临床提供更可靠的诊断工具。

2. 文献综述解析

作者对现有非侵入性肝纤维化诊断方法的评述逻辑,按技术类型分为“血清生物标志物”和“弹性成像技术”两类,并系统总结其优势与局限性:

现有研究的核心结论与局限

  1. 血清生物标志物(APRI、FIB-4)
  2. 优势:基于常规血清参数(AST、ALT、血小板、年龄),公式简单、易计算,无需额外设备。
  3. 局限:仅反映肝脏炎症和凝血功能,无法直接关联纤维化的结构改变,准确性低(AUROC多<0.75),尤其在中度纤维化患者中容易漏诊。

  4. 弹性成像技术(TE)

  5. 优势:通过剪切波测量肝硬度,直接反映纤维化程度,准确性高于血清标志物(AUROC约0.8-0.9),已被纳入EASL指南。
  6. 局限:设备成本高、需专业操作,受BMI(肥胖患者结果不可靠)、腹水、肝脏炎症活动度影响,且在中文CHB队列中的大规模验证数据不足。

本研究的创新价值

作者指出,现有研究多单独使用某一类方法,未充分整合多源数据(如TE+血清+超声),且在中文队列中的准确性不足。本研究的创新点在于:
- 数据整合:首次在中文CHB队列中,结合机器学习算法,整合TE结果、血清生物标志物(血小板、ALT、凝血酶原时间(PT)、III型前胶原氨基端肽(PIIINP)等)和超声参数(脾静脉直径),覆盖“功能-结构-力学”多维度信息;
- 多中心验证:通过4个中心的训练集(淮安、吉林)和验证集(安徽、北京)验证模型性能,提高结果的通用性和临床适用性。

3. 研究思路总结与详细解析

本研究为回顾性多中心研究,整体框架为:“回顾性收集患者数据→以肝活检为金标准划分训练/验证集→整合多源参数→机器学习模型开发→外部验证性能”。具体分为以下关键环节:

3.1 研究人群筛选与基线特征

实验目的:选取符合条件的CHB患者,确保研究人群的同质性,减少混杂因素干扰。
方法细节:回顾性收集2008-2017年来自4个中心(淮安第四人民医院、北京佑安医院、吉林肝病医院、安徽中医药大学第一附属医院)的CHB患者数据。纳入标准:未接受抗病毒治疗、同时行肝活检、血清学检查、超声检查和Fibroscan测量;排除标准:合并HCV/HDV/HIV感染、HCC或其他肿瘤、酒精摄入>20g/天、严重肝衰竭(黄疸/腹水或转氨酶>10倍ULN)、心力衰竭、妊娠、BMI≥30kg/m²。
结果解读:初始纳入1843例患者,经排除(如合并肿瘤、病毒共感染、数据不全)后,最终纳入1289例。其中,训练集(淮安、吉林)549例,验证集(安徽)408例、(北京)332例。基线特征显示:63.2%患者存在显著纤维化(F≥2),22.5%为肝硬化(F4);约29.6%患者有肝脏炎症活动(A2/A3),无脂肪变性报告。

研究人群流程图

3.2 肝活检(金标准)实施

实验目的:获取肝纤维化的病理金标准,为模型开发和验证提供参考。
方法细节:超声引导下经皮肝穿刺活检,标本经福尔马林固定、石蜡包埋后,由3位资深病理学家盲法评估(若结果不一致,由第3位病理学家裁决);排除样本量<3个门管区的“不合格标本”。
结果解读:所有活检无并发症报告;994例(77.1%)标本的病理结果一致,剩余标本经第3位病理学家确认;最终63.2%患者为显著纤维化(F≥2),22.5%为肝硬化(F4)。

3.3 瞬时弹性成像(TE)测量

实验目的:获取肝硬度值(LSM),作为纤维化程度的力学指标。
方法细节:使用Fibroscan(FS402,Echosens,法国)测量肝硬度,由专业技术人员按照操作规范进行:每例患者测量10次,取中位数作为最终LSM;若中位数>7.1kPa且四分位距(IQR)/LSM>0.30,则结果视为“不可靠”并排除。
结果解读:所有纳入患者的TE结果均符合可靠性标准;训练集中,TE预测显著纤维化的AUROC为0.886(95%CI 0.856-0.917),预测肝硬化的AUROC为0.880(95%CI 0.844-0.917),准确性高于血清标志物,但仍有提升空间。

3.4 传统血清纤维化指数计算

实验目的:计算APRI和FIB-4,用于与FibroBox的性能比较。
方法细节
- APRI公式:(AST/ULN×100)/血小板计数(×10⁹/L);
- FIB-4公式:(年龄×AST)/(血小板计数×√ALT)。
结果解读:训练集中,APRI预测显著纤维化的AUROC为0.692(95%CI 0.643-0.741),预测肝硬化为0.705(95%CI 0.659-0.752);FIB-4的AUROC分别为0.707(95%CI 0.659-0.755)和0.758(95%CI 0.713-0.804),均显著低于TE和FibroBox。

3.5 超声参数测量

实验目的:获取肝脏及门静脉系统的结构参数,补充纤维化的解剖学信息。
方法细节:超声测量脾脏大小(长×厚,单位:mm²)、脾静脉直径(单位:mm)、门静脉直径(单位:mm),每参数测量3次取均值,由经验丰富的超声医师操作。
结果解读:脾静脉直径等参数与肝纤维化程度显著相关(Spearman相关分析,P<0.05),最终被纳入FibroBox的变量选择。

3.6 FibroBox模型构建与变量选择

实验目的:开发整合多源数据的机器学习模型,筛选最具预测价值的变量。
方法细节
1. 变量筛选:首先对训练集的20余个临床参数(TE结果、血清标志物、超声参数)进行Spearman相关分析,筛选与肝纤维化显著相关的变量;再通过LASSO逻辑回归(最小绝对收缩与选择算子)和过滤法,去除冗余变量,最终保留9个核心变量:TE结果、血小板计数、ALT、PT、III型前胶原氨基端肽(PIIINP)、IV型胶原、层粘连蛋白、透明质酸(HA)、脾静脉直径。
2. 模型训练:使用Python 3.7实现机器学习模型(具体算法见补充材料),以肝活检结果为标签,训练FibroBox模型。
结果解读:训练集中,FibroBox预测显著纤维化的AUROC为0.914(95%CI 0.890-0.938),预测肝硬化的AUROC为0.914(95%CI 0.885-0.943),均显著高于TE、APRI和FIB-4(Delong检验,P<0.05);模型的最优cutoff值为:显著纤维化0.38,肝硬化0.56。

LASSO回归变量选择图

3.7 模型性能评估与统计分析

实验目的:在外部验证集验证FibroBox的性能,比较其与现有方法的优劣。
方法细节
- 准确性评估:使用受试者工作特征曲线下面积(AUROC);
- 差异比较:用Delong检验比较AUROC的统计学差异;
- 临床净获益:用决策曲线分析(DCA)评估模型的实际应用价值;
- 统计工具:SPSS 19.0(描述性统计)、R 3.5.1(AUROC、DCA)。
结果解读
- 安徽验证集(n=408):FibroBox预测显著纤维化的AUROC为0.88(95%CI 0.84-0.92),肝硬化为0.87(95%CI 0.82-0.92),均高于TE(0.88、0.88)、APRI(0.66、0.72)、FIB-4(0.70、0.75);
- 北京验证集(n=332):FibroBox预测显著纤维化的AUROC为0.87(95%CI 0.83-0.91),显著高于TE(0.82,P<0.001)、APRI(0.70,P<0.001)、FIB-4(0.67,P<0.001);预测肝硬化的AUROC为0.90(95%CI 0.85-0.94),高于APRI(0.75,P<0.001)、FIB-4(0.70,P<0.001),与TE(0.89)无显著差异(P=0.863);
- 临床净获益:DCA显示,FibroBox在“阈值概率0.1-0.9”范围内的净获益均高于TE、APRI和FIB-4,更适合临床应用。

ROC曲线比较图


决策曲线分析图

4. Biomarker研究及发现成果解析

Biomarker定位与筛选逻辑

本研究的核心Biomarker是复合模型FibroBox,而非单一分子——它整合了“力学指标(TE)、血清生化指标(血小板、ALT、PT等)、纤维化特异性标志物(PIIINP、IV型胶原)、超声结构参数(脾静脉直径)”四大类数据,覆盖肝纤维化的“功能-结构-力学”多维度特征。其筛选逻辑为:
1. 相关性筛选:通过Spearman分析筛选与肝纤维化显著相关的变量;
2. 冗余去除:用LASSO回归压缩变量空间,保留最具预测价值的9个变量;
3. 模型验证:通过训练集(淮安、吉林)和验证集(安徽、北京)验证模型的通用性。

研究过程详述

  • Biomarker来源:CHB患者的临床数据(TE测量结果、血清样本检测、超声图像分析);
  • 验证方法
  • 训练集验证:在淮安、吉林队列(n=549)中训练模型,确定最优cutoff值(显著纤维化0.38,肝硬化0.56);
  • 外部验证:在安徽(n=408)和北京(n=332)队列中,评估模型的AUROC、敏感度、特异度;
  • 性能数据
  • 安徽验证集:FibroBox诊断显著纤维化的准确率为81%(敏感度0.80,特异度0.82),肝硬化为81%(敏感度0.51,特异度0.94);
  • 北京验证集:诊断显著纤维化的准确率为81%,肝硬化为84%。

核心成果提炼

  1. 功能关联:FibroBox可有效预测CHB患者的显著纤维化(F≥2)和肝硬化(F4),其AUROC在验证集中均>0.85(显著纤维化:0.87-0.88;肝硬化:0.87-0.90),显著高于APRI(0.66-0.70)和FIB-4(0.67-0.75);
  2. 创新性:首次在中文CHB队列中整合多源数据开发机器学习模型,解决了现有方法“单一维度、准确性不足”的问题;
  3. 临床价值:FibroBox的临床净获益高于现有方法,且无需额外设备(基于常规临床检查数据),适合在中国基层医院推广。

局限性与展望

本研究为回顾性设计,存在回忆偏倚;部分纤维化特异性标志物(如PIIINP、IV型胶原)在基层医院不易获取,未来需简化模型参数;此外,模型未纳入肥胖患者(BMI≥30kg/m²),需进一步验证其在特殊人群中的性能。

综上,FibroBox作为整合多源数据的新型非侵入性工具,为CHB患者的肝纤维化诊断提供了更准确的选择,有望成为肝活检的可行替代方案。

特别声明

1、本页面内容包含部分的内容是基于公开信息的合理引用;引用内容仅为补充信息,不代表本站立场。

2、若认为本页面引用内容涉及侵权,请及时与本站联系,我们将第一时间处理。

3、其他媒体/个人如需使用本页面原创内容,需注明“来源:[生知库]”并获得授权;使用引用内容的,需自行联系原作者获得许可。

4、投稿及合作请联系:info@biocloudy.com。