European Radiology:比较深度学习方法与多参数统计模型对肺结节的恶性肿瘤危险分层

时间:2025-02-13 12:14:51   热度:37.1℃   作者:网络

肺部结节是胸部计算机断层扫描(CT)中常见的发现情况,其病因多样,从良性表现到肺癌都有可能,仅靠目视检查往往难以区分,这给后续管理带来了持续的难题。随着肺癌筛查项目的不断推行,胸部 CT 扫描数量日益增多,发现的结节也越来越多,这使得放射科医生的工作量不断增加。仅在美国,每年大约就有 156 万个肺部结节被诊断出来,在所有胸部 CT 检查中,近 31% 会发现偶然出现的肺部结节。因此,在临床实践中,需要对肺部结节进行有效的风险分层,以避免不必要的随访、避免为明确结节性质而进行侵入性操作,也避免因将结节误判为恶性给患者带来不必要的担忧,或因误判为良性而延误治疗或未进行治疗。

在临床实践中,弗莱施纳学会发布的指南可能是肺部结节管理方面应用最广泛的系统。该指南基于结节数量及其平均结节直径或体积,将患者分为低风险和高风险组,相应的建议从针对低风险且结节较小的患者无需随访,到针对高风险且结节较大的患者建议进行正电子发射断层扫描 / CT 或组织取样不等。不过,这些指南仅在肺癌筛查人群之外的患者中得到验证,因为肺癌筛查人群有着不同的肺癌风险特征。

布鲁克大学模型是一种多变量统计方法,是在泛加拿大肺癌早期检测研究背景下专门针对筛查情况开发的。该模型结合结节特征和患者特征来计算肺部结节的恶性风险,但并未提出管理指南。尽管是针对肺癌筛查情况开发的,但该模型也已在偶然发现肺部结节的患者队列中得到验证。然而,在很多临床情况下,放射科医生对患者特征的了解有限,这会降低该模型的准确性。

美国放射学会提出了一个用于肺癌筛查背景下发现的肺部结节管理的系统,即肺部影像报告和数据系统(Lung - RADS®),目前是 2022 年发布的第三版。与弗莱施纳学会指南类似,肺部影像报告和数据系统(Lung - RADS®)侧重于肺部结节的影像学评估,考虑结节大小、形态和位置等因素,将结节分为六组,对应的恶性风险从评分 1 - 2 组的 <1% 到最高评分组(4B 和 4X)的> 15% 不等,相应的管理建议从继续每年筛查到进一步进行影像学检查或组织取样不等。虽然严格来说它并非针对偶然发现的肺部结节开发的,但鉴于它与弗莱施纳学会指南的相似性以及在筛查场景中的广泛应用,使其成为一个值得在偶然发现肺部结节的患者队列中进一步研究的风险分层模型。

尽管已经存在一些肺部结节风险分层的既定方法,但仍存在局限性,这些方法可能比较耗时,需要仔细评估结节特征,甚至需要纳入在阅片时可能不易获取的患者特征信息。

将人工智能融入放射学工作流程有可能极大地改变放射科医生的工作方式,其目标是减轻工作量,并可能在决策过程中提供支持。Optellum 公司开发了一种基于深度学习的肺部结节恶性预测方法,即 LCP - CNN 评分。该模型基于美国国家肺癌筛查试验的数据集进行训练,随后在 LUCINDA 研究(利用人工智能和大数据进行早期肺癌诊断)中得到验证。不同作者对 LCP - CNN 评分的性能进行了研究,结果显示其相比于布鲁克模型和梅奥诊所模型表现更好,也有研究对比了其与英国胸科学会指南在结节管理方面的影响,或者考察了其在成像参数变化时的性能表现。


最近,发表在European Radiology 上的一篇文章评估了基于深度学习的肺癌预测卷积神经网络(LCP - CNN)方法,与多参数统计方法(布鲁克模型和肺部影像报告和数据系统(Lung - RADS®))相比,在具有不同风险特征和潜在肺部疾病的队列中对结节进行风险分类的性能表现。

研究对包含 5 - 30 毫米肺部结节的非增强和增强计算机断层扫描(CT)图像进行回顾性分析。以组织病理学结果或随访稳定性来定义真实情况(ground truth)。最终对 297 名患者的 422 个符合条件的结节进行分析,其中 105 个结节为恶性。通过诊断准确性测量(包括针对不同亚组(总体、筛查、肺气肿和间质性肺病)的受试者工作特征曲线(ROC)分析)来评估肺癌预测卷积神经网络(LCP - CNN)、布鲁克模型以及肺部影像报告和数据系统(Lung - RADS®)的分类性能。

在总体和筛查队列中,肺癌预测卷积神经网络(LCP - CNN)相较于布鲁克模型表现出更优的性能,其受试者工作特征曲线下面积(AUC)分别为 0.92(95% 置信区间:0.89 - 0.94)和 0.93(95% 置信区间:0.89 - 0.96)。在总体、筛查和肺气肿队列中,当风险阈值为 5% 时,肺癌预测卷积神经网络(LCP - CNN)相较于布鲁克模型和肺部影像报告和数据系统(Lung - RADS®)展现出更优的敏感度。在所有疾病组中,当阈值为 65% 时,相较于布鲁克模型,肺癌预测卷积神经网络(LCP - CNN)也展现出更优的敏感度,相较于肺部影像报告和数据系统(Lung - RADS®),其敏感度更好或与之相等。在不同亚组之间,未发现肺癌预测卷积神经网络(LCP - CNN)性能存在显著差异。


图 经LCP-CNN (A, B)、Brock模型和Lung- RADS®(C, D)分类为假阴性的偶发性肺结节的研究实例

本研究进一步证明了将基于深度学习的决策支持系统融入肺部结节分类工作流程的潜力,且这种融入不受个体患者风险特征和潜在肺部疾病的影响。

原文出处:

Lars Piskorski,Manuel Debic,Oyunbileg von Stackelberg,et al.Malignancy risk stratification for pulmonary nodules: comparing a deep learning approach to multiparametric statistical models in different disease groups.DOI:10.1007/s00330-024-11256-8

上一篇: European Radiology:肥...

下一篇: “低危”MDS:是否需要改变名称?


 本站广告