《Ultrasonics》:Predicting transcranial ultrasound insertion loss using skull CT: A deep learning approach
编辑推荐:
通过CT扫描构建的深度学习模型mDPI-Net可高效预测颅骨超声插入损失,较传统数值方法(如k-Wave)误差降低8.7%,计算效率提升300倍,并揭示颅骨密度、厚度与形态结构对声衰减的内在关联。
宁 王 | 李 汉 | 廖 金鹏 | 泰勒·哈利威尔 | 黄志宏
英国约克大学物理、工程与技术学院
摘要
经颅超声(tUS)是一种非侵入性的神经调节技术,应用于脑部疾病的治疗。然而,颅骨对超声的衰减显著影响了能量的聚焦传输。超声强度的损失可以通过插入损失(IL)来量化。准确的IL预测对于优化超声传输至关重要。传统的基于网格的数值方法在计算上代价高昂,并且对参数变化非常敏感。为了解决这些问题,我们假设颅骨的结构特征与IL之间存在内在关联,并且可以通过深度学习方法有效捕捉这些特征。在这项研究中,我们对20个人类颅骨标本进行了传输实验,测量了220 kHz、650 kHz和1000 kHz三个频率下的IL。我们提出了一种基于颅骨计算机断层扫描(CT)的改进型双路径Inception神经网络(mDPI-Net)用于IL预测。比较结果显示,mDPI-Net的性能优于均匀伪谱方法(峰值压力误差:26.6% vs 34.3%,IL偏差:2.47 dB vs 4.64 dB),并且与非均匀模拟结果相当(峰值压力误差:26.6% vs 21.0%,IL偏差:2.47 dB vs 1.69 dB),同时计算效率也得到了提高,从每样本15分钟缩短到了0.5秒。该方法证明了颅骨CT扫描能够自然地编码与IL相关的结构信息。在实验设置固定的情况下,深度学习有望实现实时或快速的术前IL预测,并在经颅超声应用中实现更精确的剂量控制,如神经调节、经颅药物输送和非侵入性脑刺激。
引言
经颅聚焦超声是一种非侵入性的、高空间分辨率的神经调节技术,在病理神经元消融、药物输送和精确脑刺激方面展现了其潜力[1]、[2]、[3]。插入损失(IL)量化了超声穿透介质时的声能损失,而在经颅超声(tUS)过程中准确预测IL对于优化超声传输和提高治疗效果至关重要,有助于剂量控制和手术计划[3]。然而,人类颅骨是一个复杂的异质结构,由皮质骨和松质骨组成,其物理性质(如厚度、孔隙率和密度)存在差异[4]、[5]。这些差异会导致声阻抗不匹配,从而引起反射和折射,而异质微观结构则导致散射;骨骼的吸收进一步衰减了传输的能量[4]。因此,超声束在穿过颅骨时可能会发生畸变、偏差甚至分裂。
为了解决这个问题,根据准确性和计算成本之间的平衡,已经开发了不同的半解析模型和数值模型[6]。半解析方法(如光线追踪)计算成本较低,但通常假设颅骨是均匀且各向同性的[9]、[10]、[11]。Bancel等人[9]报告称,光线追踪和数值方法之间的峰值压力差异约为2%,而C. Angla[10]提出了一种飞行时间最小化方法,与实验测量结果相比仅相差6%。为了评估不同方法的性能,Aubry等人[7]提出了一系列模拟模型基准测试。Drainville等人[8]进一步将这些基准测试扩展到了光线追踪模型。另一方面,现有的数值方法(如有限差分方法(FDM)和有限元方法(FEM)通过在时间和空间上离散化波动方程来计算插入损失[12]、[13]、[14]。Jing等人[15]引入了k空间方法,利用谱技术更高效地计算空间导数。其他基于k-Wave MATLAB工具箱[19]的研究[16]、[17]、[18]采用了伪谱有限差分时域(PSTD)方法,这种方法在降低所需空间分辨率的同时放宽了时间步长限制,但准确性损失不大。然而,这些基于网格的求解器仍然存在计算成本高和离散化误差的问题。粗网格缺乏准确性,而细网格则增加了计算成本。随着频率的增加,时间离散化带来的误差也变得更加明显。此外,在模拟设置过程中需要仔细调整参数,并且难以在模拟中准确复制实验设置。
人工智能(AI)和深度学习的最新进展使得数据驱动的方法能够解决多种复杂的生物医学声学问题。一类方法专注于通过修正多元素换能器的像差来优化声学聚焦。最近的研究[20]、[21]使用卷积神经网络从超声射频(RF)信号估计颅骨轮廓,并重建颅骨声速(SOS)图以进行相位像差校正。Zhang等人[22]进一步提出了一种3D U-Net,可以从SOS图预测256元素换能器的相位延迟,其焦点和栅瓣性能可与时间反转方法相媲美。另一种方法旨在重建颅内声场。Seo等人[23]采用了多模态变压器-CNN混合模型来快速生成颅内声场。近年来还出现了物理驱动的深度模型。一些工作[24]、[25]、[26]采用物理信息神经网络来解决异质介质中的波动方程。后来的研究[26]提出了一种有限差分嵌入式U-Net来计算频域中的波场。然而,很少有现有工作探索了颅骨CT特征与经颅超声插入损失之间的关系。在这项研究中,我们提出了一个基于颅骨CT图像的监督深度模型来预测经颅超声插入损失。我们将我们的模型性能与k-Wave模拟[27]和其他先进的基线深度模型进行了比较,并从模型可解释性的角度讨论了插入损失与颅骨密度、厚度和形态之间的关系。
实验设置和数据获取
本研究使用了来自邓迪大学解剖学和人类识别中心的20个人类颅骨标本。为了获取骨骼的物理性质,使用GE Revolution EVO扫描仪(GE Healthcare,美国)进行了CT扫描,并选择了增强骨骼对比度的骨滤镜。平面分辨率为0.44毫米,切片间隔为0.31毫米。扫描前,使用真空泵对标本进行脱气并浸泡过夜。
k-Wave模拟
作为比较方法,我们在MATLAB上使用k-Wave工具箱[19]进行了声学模拟。模拟设置的参数列表列在表1中,这些参数来自一项基准研究[7]。具体来说,我们保留了该基准测试中的大部分设置以确保标准化和可比性。根据我们的实际实验设置进行了一些修改,包括换能器和水听器的相对位置、源频率等。
模型性能
表3展示了各种网络架构的性能比较。作为比较方法,我们实现了一个轻量级的3D CNN(Light-3D-CNN),它由三个卷积层和三个全连接层组成,以及一个简化版的InceptionNet v3(Light-InceptionNet v3),具有较少的通道和模块,总参数为300万。此外,我们还采用了基于第2.3.2节中提取的全局平均结构特征的线性回归模型。
讨论
本研究提出了一种基于深度学习的方法,使用双路径Inception神经网络(mDPI-Net)来预测经颅超声插入损失(IL)。所提出的模型结合了通过卷积网络提取的3D CT图像特征和手动提取的颅骨结构特征,以预测不同频率下的IL。该方法提高了计算效率,而k-Wave模拟每个样本大约需要20-40分钟的时间。
结论
在这项研究中,我们对20个人类颅骨标本进行了受控的超声传输实验,并开发了一个基于双路径Inception的深度学习模型(mDPI-Net),使用颅骨CT图像来预测经颅超声插入损失(IL)。对47个颅骨子体积的比较显示,mDPI-Net在均匀设置下的性能优于伪谱方法和其他深度网络架构,并且与非均匀模拟的结果相当。
资金来源
本研究未获得公共部门、商业部门或非营利部门的任何特定资助。
CRediT作者贡献声明
宁 王:写作 – 审稿与编辑,撰写原始稿件,可视化,验证,软件,方法论,数据管理,概念化。李 汉:写作 – 审稿与编辑,撰写原始稿件,资源管理,方法论,数据管理。廖 金鹏:写作 – 审稿与编辑,概念化。泰勒·哈利威尔:数据管理。黄志宏:写作 – 审稿与编辑,监督,项目管理。
伦理批准
邓迪大学Thiel咨询小组批准了在本研究中使用人类组织标本。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
术语表
- 缩写
- 全称
AI
人工智能
Adam
自适应矩估计(优化器)
CNN
卷积神经网络
CFL
库朗-弗里德里希斯-莱维(条件)
CT
计算机断层扫描
FDM
有限差分方法
FFT
快速傅里叶变换
GPU
图形处理单元
Grad-CAM
梯度加权类别激活映射
HU
亨斯菲尔德单位
IL
插入损失 |
L1 Loss
最小绝对偏差损失函数 |
MAE
平均绝对误差 |
mDPI-Net
改进型双路径Inception网络 |
PSTD |
伪谱有限差分 |