European Radiology:使用临床、超声特征和机器学习方法预测甲状腺结节的恶性风险 

时间:2025-03-21 12:12:45   热度:37.1℃   作者:网络

甲状腺结节十分普遍,高分辨率超声在约 60% 的普通人群中可检测到甲状腺结节,但最终为恶性的比例很低(约 5%)。分化型甲状腺癌(DTC)包括乳头状甲状腺癌(PTC)、滤泡状甲状腺癌(FTC)和嗜酸性细胞癌(HTC),占所有甲状腺癌的 90% 以上。近几十年来,全球甲状腺癌的发病率上升,但死亡率无显著增加,可能与诊断方法(如医学影像和细针穿刺活检(FNA))的使用增加有关。然而,甲状腺结节患者的短期和长期管理(包括定期门诊就诊、颈部超声检查、FNA、分子诊断测试以及部分患者的诊断性甲状腺叶切除术)的成本和并发症问题日益受到关注,因此需要改进且更准确的方法来处理这些普遍存在的病变。

DTC 尤其是 PTC 的治疗方式主要包括手术、左甲状腺素抑制治疗和放射性碘治疗。甲状腺结节在出现梗阻性并发症时是手术指征之一。虽然甲状腺结节的个体化治疗取决于病变性质,但手术仍是主要手段,其目的是诊断甲状腺结节的良恶性。准确的术前诊断有助于更好地进行手术,避免不必要的副作用,降低术后复发风险,甚至影响术后辅助治疗的选择。因此,早期检测和区分甲状腺结节的良恶性,避免不必要的 FNA 活检和过度治疗(如手术)至关重要。

超声(US)是评估甲状腺结节最常用的方法,但结节的结构导致超声图像复杂,良恶性结节存在一些交叉征象,基于操作者经验的超声难以快速、满意地区分良恶性结节。某些超声特征(如结节实性部分低回声、边缘不规则或有毛刺且无晕环、纵横比大于 1、微小钙化和甲状腺外侵犯征象)会增加恶性风险,但这些特征单独使用时诊断性能(灵敏度和特异度)不够高。

为了临床管理甲状腺结节,设计了多个风险评估和分类系统,最初是定性的,美国放射学会甲状腺影像报告和数据系统(ACR TI - RADS)将其转变为定量系统。先前研究表明,ACR TI - RADS 在评估甲状腺结节时,不必要 FNA 的比例明显低于其他系统(如美国甲状腺协会(ATA)、欧洲甲状腺协会 TI - RADS 和韩国甲状腺协会 TI - RADS)。然而,各种版本的 TI - RADS 只能区分四到五个甲状腺结节风险组,且 ACR TI - RADS 特异度较低(44.0% - 67.3%),可能导致许多无临床意义结节的患者接受不必要的活检甚至诊断性叶切除术。此外,使用 ACR TI - RADS 时,与其他指南相比,更多的恶性病例未被推荐进行 FNA,并且在检测风险水平时仍存在显著的观察者间差异和整体主观性。

除超声表现外,甲状腺结节恶性的其他风险因素(如家族史、年龄、性别和头颈部放疗史)未包含在已知的风险分层系统(如 ACR TIRADS)中。因此,需要一种更全面、非侵入性且低成本的方法,结合超声表现和个体临床特征,提高甲状腺结节恶性诊断的灵敏度和特异度。先前的研究基于不同数据集开发统计模型来预测恶性结节的发生,但主要使用描述性统计或逻辑回归,忽略了临床和人口统计学变量之间复杂的非线性关系。机器学习(ML)算法已被证明能提供比人类专家更好的预测,它利用统计方法从医学数据中识别潜在模式和分类,并已成功应用于改善患者护理。近期研究将 ML 技术引入甲状腺癌筛查,通过表征超声图像中的形态和组织学特征,ML 表现出与经验丰富的放射科医生相似甚至更好的性能。


最近,发表在European Radiology 上的一篇文章利用临床和超声特征以及机器学习(ML)方法开发并验证了一个预测甲状腺结节恶性风险的模型。

这是一项回顾性研究,基于 1035 个甲状腺结节(845 个良性和 190 个恶性)的临床和超声特征来开发和验证风险预测模型。采用多元逻辑回归选择关键特征来开发模型。评估了八种 ML 算法预测甲状腺结节恶性风险的能力。将表现最佳的算法的预测能力与美国放射学会甲状腺影像报告和数据系统(ACR TI - RADS)以及美国甲状腺协会(ATA)指南进行比较。

根据曲线下面积(AUC)(88.3,95% 置信区间:81.2 - 94.2)、灵敏度(84.2,95% 置信区间:71.1 - 94.7)、特异度(92.3,95% 置信区间:88.2 - 95.9)、阳性预测值(71.4,95% 置信区间:60.4 - 83.3)和阴性预测值(96.3,95% 置信区间:93.5 - 98.8),XGBoost 算法的表现优于其他 ML 算法、ACR TI - RADS 和 ATA。ACR TI - RADS 的上述指标分别为 54.2%、63.2%、48.5%、21.1% 和 84.8%,ATA 的上述指标分别为 44.3%、76.3%、27.2%、18.4% 和 81.6%。ACR TI - RADS 和 ATA 的不必要 FNA 率分别为 43% 和 63%,显著高于 XGBoost 的 7%。


图 ROC曲线用于比较ML模型的预测性能

本研究证明了 ML 方法能够提高预测甲状腺恶性风险的准确性,并且通过降低不必要的 FNA 率,在优化医疗资源方面具有潜在益处。通过基于网络的工具使用所提出的模型,可以为甲状腺结节管理和个性化治疗的临床决策提供便利。

原文出处:

Seyed Mahdi Hosseini Sarkhosh,Nooshin Shirzad,Mahdieh Taghvaei,et al.Prediction of thyroid malignancy risk using clinical and ultrasonography features and a machine learning approach.DOI:10.1007/s00330-025-11434-2

上一篇: Nature:线粒体的"能量之...

下一篇: 敏感性皮肤的发病机制及治疗进展


 本站广告