【期刊导读】HBsAg清除预测模型:基于临床数据的多种算法比较表明Logistic回归模型综合效能更优
时间:2025-03-22 12:08:43 热度:37.1℃ 作者:网络
编者按
基于聚乙二醇干扰素α(PEG IFNα)的治疗是当前实现临床治愈的最佳选择。为不断提高PEG IFNα的临床疗效,开发早期预测工具用于优化治疗至关重要。目前已有多项临床研究结果表明,患者治疗前的基线特征、治疗过程中的病毒学和免疫学生物标志物可预测HBsAg清除。既往研究多聚焦单一生物标志物,而基于多维度临床参数的动态预测模型正在不断探索中。
近期,福建医科大学孟超肝胆医院潘晨教授和林春教授团队发表相关研究,结果显示基线HBsAg ≤ 1500 IU/mL的慢乙肝患者基于PEG IFNα治疗48周的HBsAg清除率为38.63%。通过整合基线及治疗早期动态指标,如基线HBsAg、第12周HBcAb水平、中性粒细胞计数等,构建基于机器学习算法的不同HBsAg清除预测模型并验证其效能,为精准预测HBsAg清除提供了可量化的临床工具。
研究方法
本研究为回顾性队列研究,纳入2019年1月至2024年4月期间接受PEG IFNα联合核苷类似物治疗的224例慢乙肝患者。纳入标准包括:HBsAg阳性≥ 6个月、曾接受恩替卡韦/替诺福韦等核苷类药物治疗。患者按4 : 1比例随机分为训练集(n = 179)与验证集(n = 45)。PEG IFNα联合治疗疗程为48周,在治疗期间或第48周出现HBsAg清除定义为应答者(R),未获得HBsAg清除定义为无应答者(NRs)。通过四种机器学习算法建立了预测模型 : 随机森林(RF)、梯度提升决策树(GBDT)、极限梯度提升(XGBoost)、支持向量机(SVM),并通过AUC、敏感性、特异性等指标评估效能。
患者基线
训练集共纳入179例患者,其中男性139例、女性40例,平均年龄36.9岁。该队列中44例患者实现HBsAg清除。应答组与无应答组间基线log2(HBsAg)水平存在统计学显著性差异(p < 0.05)。
验证集包含45例患者(男性32例,女性13例),平均年龄39.3岁,其中13例达到HBsAg清除。
训练集的患者基线
研究结果
01 基线HBsAg ≤ 1500 IU/mL的慢乙肝患者基于PEG IFNα治疗48周的HBsAg清除率为38.63%
总体基于PEG IFNα治疗48周的HBsAg清除率为25.45%(57/244)。按基线HBsAg水平分层分析显示,HBsAg ≤ 1500 IU/mL、≤ 1000 IU/mL、≤ 500 IU/mL、≤ 100 IU/mL的HBsAg清除率分别为38.63%、45.63%、51.35%和63.89%。
在训练集中,单因素分析显示,基线log2(HBsAg)(p < 0.001)、第12周HBcAb水平(p = 0.039)与HBsAg清除显著相关。
训练集中单因素分析与HBsAg清除相关因素
02 建立并验证不同HBsAg清除预测模型,Logistic预测模型的综合效能最佳
LASSO分析筛选出12个预测变量,进行二元Logistic回归分析(逐步向前法),最终预测模型纳入性别、年龄、基线log2(HBsAg)、第12周HBsAg下降率([第12周HBsAg−基线HBsAg]/基线HBsAg)、第12周HBcAb及中性粒细胞计数。
Logistic回归分析HBsAg清除预测因素
基于上述六个变量构建机器学习模型,验证集用于评估已开发模型的预测效能。在Logistic回归分析中,预测模型在训练集中的敏感性为0.889(95% CI:0.836 - 0.942),特异性为0.750(95% CI:0.622 - 0.878)。ROC曲线下面积(AUC)值为0.862(0.789 - 0.936)。
Logistic回归模型在训练集中的预测效能
Logistic预测模型在验证集中ROC曲线的AUC值为0.858(0.736 - 0.980),敏感性为0.750(0.600 - 0.900),特异性为0.769(0.540 - 0.998)。校准曲线和决策曲线分析结果表明该模型具有良好的预测效能。
Logistic回归模型在验证集中的预测效能
在验证集中评估四种机器学习算法模型预测效能。支持向量机(SVM)的特异性最高(0.775),GBDT模型的F1分数(反映HBsAg清除阳性预测能力)最高(0.853)。而Logistic回归模型的准确率(0.756)和AUC值(0.858)最高。
五种算法模型在验证集中的预测效能
03 Logistic回归模型的HBsAg清除预测公式
基于对预测效能的综合评估,选择Logistic回归模型作为最终预测模型,其HBsAg清除预测公式为:p = 9.42 - 1.49 × 性别 - 0.07 × 年龄 - 0.55 × 基线log2 (HBsAg) - 0.11 × 第12周HBsAg下降率 - 1.28 × 第12周HBcAb - 0.62 × 第12周中性粒细胞计数。
Logistic回归模型预测HBsAg清除的列线图
计算每个预测因素的SHapley加性解释(SHAP)值,若预测因素特征越显著表明其对模型影响越大。按预测因素的重要性进行从高到低排序:基线log2(HBsAg)(SHAP值:-0.456)、第12周HBsAg下降率(-0.342)、第12周中性粒细胞计数(-0.178)、第12周HBcAb(-0.175)、性别(-0.089)和年龄(-0.065)。
不同预测因素的SHAP值
肝霖君有话说
已有研究基于HBsAg水平构建了HBsAg清除率预测模型(相关链接),为临床决策提供依据。近年来,新型预测模型(如PEG IFNα-2b治疗获得HBsAg清除的疗程动态预测模型)的探索进一步拓展了临床实践的应用(相关链接)。本研究表明基线HBsAg、第12周HBcAb水平、中性粒细胞计数等因素与基于PEG IFNα治疗的HBsAg清除显著相关。进一步通过机器学习算法(如XGBoost、随机森林)开发并验证不同HBsAg清除预测模型,综合比较得出Logistic回归模型的预测效能最佳,为慢性乙型肝炎患者的分层管理及个体化治疗路径选择提供了高精度的量化工具。
参考文献:
Ye YM, Lin Y, Sun F, et al. A predictive model for functional cure in chronic HBV patients treated with pegylated interferon alpha: a comparative study of multiple algorithms based on clinical data[J]. Virol J, 2024, 21(1):333.