《Frontiers in Oncology》:Ultrasound-based artificial intelligence for breast lesion classification
编辑推荐:
本综述聚焦人工智能(AI)在乳腺超声领域的最新进展,特别是其在病灶良恶性分类与分级诊断中的应用。文章不仅探讨了机器学习(ML)、深度学习(DL)和卷积神经网络(CNN)等核心技术,还系统分析了影像组学、可解释人工智能(XAI)以及以S-Detect为代表的商业化计算机辅助诊断(CAD)系统的现状。作者指出,尽管AI在研究中展现了高精度潜力,但其从实验室迈向临床仍面临重大挑战,包括缺乏对非肿块型病灶(约占恶性病变的15–20%)的诊断研究、生成式AI(GenAI)临床验证不足,以及商业CAD系统多中心有效性数据有限。全文强调,必须通过前瞻性多中心试验、解决数据异质性以及将XAI与临床工作流深度融合,才能实现AI向稳健、可推广的临床工具的切实转化。
人工智能照亮乳腺超声诊疗之路
在全球范围内,乳腺癌是女性中最常见的恶性肿瘤。及时、准确的筛查对于改善患者预后至关重要。乳腺超声,作为一种无电离辐射、适用于致密型乳腺的重要诊断工具,其应用价值日益凸显。然而,传统的超声诊断高度依赖操作者经验,并存在解读的主观差异性。人工智能(AI)的兴起,特别是其在医学影像分析领域的应用,为解决这些问题带来了革命性的希望。
AI技术的全景概览
人工智能通过其分支技术,如机器学习(ML)和深度学习(DL),正在彻底改变医学影像的分析模式。与需要手动提取特征的ML相比,DL及其核心架构——卷积神经网络(CNN)能够从原始数据中自动学习多层次、抽象的特征,尤其适用于图像识别任务。CNN通过卷积、池化等操作,高效提取并保留了图像的空间关系,使其在乳腺超声图像分析中表现出色。近年来,生成式AI(GenAI)崭露头角,它不仅能生成高质量的合成图像以扩充训练数据集,还能用于图像去噪和增强,直接提升图像质量与诊断信心。影像组学(Radiomics)则通过从图像中高通量提取定量特征,结合AI算法,将图像信息转化为可量化的“生物标志物”,为病灶分类和预后预测提供了新的客观依据。
AI在乳腺超声中的具体应用
在乳腺超声实践中,AI的应用主要围绕两大核心任务:病灶检测与良恶性分类。基于B型超声(B-US)的图像,AI模型能够自动分析病灶的形态、边缘、回声等特征。更为先进的研究则结合了剪切波弹性成像(SWE)等新技术,通过量化组织硬度等生物力学特性,进一步提升诊断的客观性。
大量的研究表明,AI模型在区分良恶性病灶方面可以达到与经验丰富的放射科医生相当甚至更高的准确性。例如,一些研究报道,基于CNN的模型在区分良恶性病灶时,其曲线下面积(AUC)可超过0.90。然而,这些令人瞩目的结果大多来自单中心、回顾性的研究,其普适性仍需在更广泛、更多样化的临床环境中加以验证。
一个特别值得关注的领域是非肿块型病灶的诊断,这类病灶约占乳腺恶性肿瘤的15%至20%,形态不典型,是超声诊断的难点。研究表明,基于MobileNet等轻量级DL模型,能够有效提升对此类不典型病灶的诊断能力,展现了AI在处理复杂病例中的潜力。
可解释AI:打开算法“黑箱”
深度学习模型虽强大,但其决策过程常被视为“黑箱”,这阻碍了临床医生对其的信任和采纳。可解释人工智能(XAI)技术的发展旨在解决这一问题。例如,梯度加权类激活映射(Grad-CAM)等技术能够生成“热力图”,直观地显示模型在做决策时关注的图像区域。这不仅能验证模型的决策是否基于正确的影像学特征(如病灶边缘、微钙化),而非图像伪影,还能帮助研究人员发现和修正算法中的偏差。SHAP(沙普利加性解释)等基于博弈论的方法,则可以量化每个输入特征对最终预测的贡献度。尽管XAI提高了模型的透明度,但如何将其生成的解释与临床医生的专业术语和认知框架无缝对接,仍是未来研究的关键。
商业CAD系统:从研究到临床的桥梁
以S-Detect和KOIOS DSTM为代表的商业化计算机辅助检测与诊断(CAD)系统,标志着AI技术向临床实际应用迈出了重要一步。这些系统通常内置于超声设备或作为独立工作站,能够在图像采集时或之后,为放射科医生提供实时或离线的“第二意见”。研究显示,这类系统,特别是对于经验较少的医生,能够显著提高诊断特异性,减少不必要的穿刺活检,并改善不同观察者之间和同一观察者自身诊断的一致性。
例如,S-Detect软件通过自动或手动勾画病灶感兴趣区域(ROI),并分析其内部特征,能提供良恶性的可能性评估。多项研究证实,在S-Detect的辅助下,放射科医生对乳腺病灶的分类准确性,尤其是在BI-RADS 4a这类不确定性病灶的管理上,得到有效提升。KOIOS系统则重新定义了基于BI-RADS的风险评估层级,其决策支持有助于优化活检建议,提高活检阳性率。
然而,这些商业系统也面临挑战。它们的诊断性能可能因设定的BI-RADS风险阈值不同而波动,并且对致密型乳腺组织的诊断效能可能有所下降。最重要的是,缺乏大规模、前瞻性的多中心研究数据来全面评估其在各种真实临床场景下的有效性和稳定性。
跨越鸿沟:挑战与未来方向
尽管前景广阔,但将AI从研究原型转化为稳健可靠的临床工具,仍存在显著障碍,这构成了当前最主要的“转化鸿沟”。
首先,是数据与泛化性的挑战。目前绝大多数高精度AI模型都是在单一机构、特定设备和患者群体的回顾性数据上训练和验证的。当这些模型应用于不同医院、不同型号的超声设备或不同人种的患者时,其性能可能出现显著下降,这种现象被称为“域偏移”。解决这一问题的关键在于推动高质量、多中心、前瞻性数据集的构建,并采用联邦学习等技术在不集中数据的前提下进行模型训练,以及开发域自适应算法来提升模型的鲁棒性。
其次,是临床验证与评估标准的缺失。未来的研究需要超越单纯的诊断准确性指标(如AUC、灵敏度、特异度),转而关注更具临床意义的终点。例如,AI辅助是否能真正减少不必要的短期随访和良性活检率?是否能提高放射科医生的诊断信心和读片一致性?是否能缩短从筛查到治疗的时间?只有通过设计严谨的前瞻性临床试验来回答这些问题,才能证明AI的临床效用和价值。
最后,是整合与信任的建立。成功的临床部署要求AI系统能够无缝集成到现有工作流程中,这涉及到用户界面设计、与医院信息系统的对接以及标准化报告框架的适应。同时,建立明确的医疗法律和伦理框架,以界定AI辅助诊断中的责任与问责,并确保算法决策的公平性与无偏性,对于获得医生和患者的广泛信任至关重要。
结论
人工智能为乳腺超声的精准诊断开启了一扇新的大门。从传统的影像组学特征分析,到强大的深度学习自动特征提取,再到旨在提升透明度的可解释AI,技术正在飞速演进。商业CAD系统的出现,标志着AI开始从实验室走向诊室。然而,要跨越从“表现出潜力”到“成为临床常规”之间的鸿沟,我们必须正视并系统性地解决数据异质性、临床验证 rigor、工作流整合以及伦理法规等一系列挑战。未来的道路需要工程师、临床医生、医院管理者和监管机构的紧密协作,共同推动人工智能在乳腺超声乃至整个医学影像领域,实现其提升人类健康的终极使命。