《Analytical Chemistry》:Machine Learning for Separating Dopamine and Octopamine Electrochemical Signals in Drosophila
编辑推荐:
本文开发了一种改进的U-Net回归模型,成功实现了果蝇大脑中多巴胺(DA)和章鱼胺(OA)快速扫描循环伏安法(FSCV)重叠信号的分离。该模型利用章鱼胺在1.1 V处的独特初级氧化峰预测其在0.7 V处的次级氧化峰,并通过信号减法精准提取多巴胺成分,归一化均方根误差(NRMSE)分别达0.06(DA)和0.08(OA)。该方法为解析时间依赖性伏安信号提供了稳健的机器学习框架。
引言
数十年来,黑腹果蝇(Drosophila melanogaster)因其遗传可操作性和明确的行为特征,一直是神经科学研究的关键模式生物。多巴胺和章鱼胺在果蝇的记忆和学习过程中发挥核心作用,其中多巴胺主要与厌恶学习相关,而章鱼胺则与食欲学习相联系。这些神经递质在环境线索触发下快速释放,凸显了对能够捕捉其快速动态的测量技术的需求。多巴胺能和章鱼胺能末梢在蘑菇体中的共定位提示了功能重叠和相互作用,因此在研究突触可塑性和行为时,区分它们的信号至关重要。
快速扫描循环伏安法(FSCV)是一种电化学方法,通过施加快速扫描速率(通常为400 V/s,10 Hz),能够实现神经递质的亚秒级检测,从而实时监测大脑中的化学波动。传统上,FSCV主要用于多巴胺的检测。然而,随着对章鱼胺在调节行为和奖励学习中作用的兴趣日益增长,研究团队开始应用FSCV研究黑腹果蝇中的章鱼胺动态。使用FSCV同时测量多巴胺和章鱼胺面临重大挑战,因为它们的氧化还原峰电位重叠,而这是伏安图中识别分析物的常用依据。章鱼胺和多巴胺结构相似,但章鱼胺的氧化还原行为包括两个氧化峰和一个还原峰。初级氧化峰约在1.1 V,对应于分子的初始氧化,但电化学副产物的进一步氧化会导致在约0.7 V处出现次级氧化峰,该电位也正是多巴胺的主要氧化峰电位。章鱼胺的次级氧化峰随时间变化且持续时间比初级峰更长,因此其伏安图形状会随时间改变。因此,需要开发方法来分离这两种电化学信号以实现同时监测。
实验部分
果蝇脑组织制备
选取5至10日龄的成年果蝇,置于冰盒中5分钟,然后转移至预冷的培养皿中再麻醉1分钟。在冰冷的解剖缓冲液中分离大脑,并使用尖头镊子小心去除胶质鞘。将提取出的脑组织以前侧朝上的方式放置,并使用适用于水相环境的生物相容性粘合剂WormGlu固定于培养皿底部。对于数据采集,将碳纤维微电极(CFME)定位在蘑菇体的跟部或内侧尖端,使用GFP标记物引导目标定位。将拉制的玻璃毛细管移液器(尖端直径约10 μm)填充所需神经递质溶液,并定位于CFME尖端约10–15 μm处。经过15分钟平衡期后,使用Picospritzer III压力注射神经递质溶液到脑组织中。注射压力固定为10 psi,注射持续时间设定约为250 ms,具体取决于原位测量的神经递质量。注射体积约为2 nL。此外,为了改变浓度,调整基线注射体积以获得五个不同浓度水平的数据。每种神经递质使用新的毛细管以避免交叉污染。使用DS-Qi2单色CMOS相机和NIS-Elements BR成像软件捕获图像并进行脑内距离量化。
神经递质注射实验
将多巴胺和章鱼胺的水溶液注射到提取的果蝇大脑中,并使用FSCV进行测量。注射的多巴胺和章鱼胺溶液浓度为10 μM,高于果蝇实验中通常测量的几百nM的生物浓度。选择此较高浓度是因为注射过程中溶液会扩散,且神经递质会被摄取清除,因此电极处的局部浓度远低于10 μM。虽然电极和玻璃毛细管之间的距离存在一定变异性,但神经递质浓度的测量为训练数据集提供了广泛的浓度范围。对于每次在果蝇体内的电极植入,对多巴胺和章鱼胺分别进行五种不同注射量的五次注射,每种神经递质获得25个数据。此外,还获得了多巴胺和章鱼胺混合物的五次注射数据。每个电极都进行了事后校准,以便将电流信号转换为浓度值。
快速扫描循环伏安法及数据处理
实验数据使用Wave-Neuro 4恒电位系统和高清晰度循环伏安法数据采集软件获取。使用标准的多巴胺FSCV波形在400 V/s扫描速率下,从-0.4 V到1.3 V,以10 Hz频率测量多巴胺和章鱼胺。采用双电极系统,包括一个碳纤维微电极作为工作电极和一个Ag/AgCl参比电极。CFME通过将7 μm碳纤维插入玻璃毛细管中制备,并使用垂直电极拉制器拉制。暴露的尖端修剪至约50 μm长度。参比电极通过氯化银丝制备。使用与CFME相同的拉制方法制备单独的玻璃毛细管(但不插入碳纤维)用于通过Picospritzer递送神经递质。然后将玻璃尖端修剪至直径约10 μm,以便在记录位点附近进行局部注射。原始伏安图数据以文本格式导出并导入MATLAB进行处理。空白数据是不含神经递质信号的背景噪声记录,在训练期间被纳入以防止对纯噪声输入产生假阳性预测。对伏安图进行背景扣除以去除电容充电电流,从而分离与神经递质氧化相关的法拉第电流。数据处理在配备AMD Ryzen 7 5700G CPU、128 GB RAM和NVIDIA GeForce RTX 3050 GPU的工作站上进行。对于每个数据集,计算3秒时间窗口内的标准差以评估信号变异性。排除噪声过大的样本。应用六阶巴特沃斯低通滤波器进行零相位数字滤波,以在衰减高频噪声的同时保留信号完整性。此外,使用3 × 3窗口大小的二维中值滤波器去除突发的噪声尖峰。
基于深度学习的信号分离
在MATLAB中开发了一个深度学习回归模型来分离重叠的多巴胺和章鱼胺信号。使用过滤后的章鱼胺伏安图和空白噪声数据生成输入-输出对,其中初级氧化峰用作输入,次级峰用作输出。所有信号使用全局均值和标准差进行归一化,存储的参数用于推理期间的逆归一化。为了提高模型鲁棒性,应用了5倍时间偏移增强,将信号最多偏移5帧,并进行零填充以保持对齐。从每个伏安图中提取感兴趣区域(ROI)并调整为128 × 128用于训练。针对此任务评估了三种深度学习架构:U-Net、ResNet18和LSTM。这些模型的基本原理、实现细节和性能比较在结果与讨论部分详细描述。
结果与讨论
信号分离与实验设计
研究在果蝇大脑蘑菇体进行了体内神经递质注射实验,并使用所得数据训练机器学习网络。使用多巴胺波形进行FSCV测量时,多巴胺在约0.7 V处显示一个氧化峰,并在约-0.2 V处有一个对应的还原峰。有一个氧化峰和一个还原峰,多巴胺表现出信号迅速达到瞬态最高峰随后逐渐衰减的特征模式。相比之下,章鱼胺在约1.1 V处显示一个初级氧化峰,随后在约0.7 V处有一个相对宽泛的次级氧化峰,还原峰发生在约-0.2 V,与多巴胺相似。章鱼胺的第一个峰在瞬态响应后迅速消失,而由附着在电极上的副产物引起的第二个峰衰减缓慢。在0.7 V处的电化学信号重叠对信号分离构成了主要挑战,尤其是当两种神经递质同时被检测时。虽然主成分回归(PCR)常用于分离FSCV中的化合物,但它只是一种二维技术,假设循环伏安图(CV)不随时间变化。因此,该方法不能用于分离多巴胺和章鱼胺,因为章鱼胺的次级氧化峰随时间变化。
本研究中的首要考虑是选择适当的训练集。虽然使用体外校准的流动注射数据最容易,但其颜色图与在组织中收集的数据不太相似。流动注射具有不受限制的扩散、没有蛋白质或组织附着在电极上,以及更快的洗脱动力学,而非再摄取。因此,由流动注射数据生成的时间、电压、电流三维颜色图在形状上不同于 evoked 多巴胺释放测量得到的数据。研究选择使用在神经递质注射到果蝇大脑后测量得到的数据进行实验。在此实验中,将碳纤维微电极和填充有神经递质溶液的锐利玻璃毛细管定位在蘑菇体的内侧叶。通过压力注射神经递质溶液,并使用快速扫描循环伏安法监测其在细胞外空间的浓度。这产生的颜色图更接近于乙酰胆碱激发的多巴胺释放数据,并且具有相同的扩散和摄取特征,因为它们处于组织中。先前采用主成分回归进行FSCV信号分析的研究一致使用体内数据进行训练以预测体内信号,凸显了使用在相同实验条件下收集的训练数据的重要性。
在此研究中,提出了一种方法,在初级和次级氧化电位附近定义感兴趣区域(ROI)。在这种方法中,初级氧化峰用作输入,次级峰用作输出来训练深度学习网络。因为章鱼胺的初级氧化电位约为1.1 V,且不与多巴胺的氧化或还原峰重叠,可以假设在混合物中,1.1 V处的信号完全来源于章鱼胺。章鱼胺的次级氧化峰由初级峰预测,然后其贡献可以从混合信号中减去。这使得能够估计混合物中的多巴胺氧化峰。
此过程中的一个关键考虑因素是碳纤维微电极是手工制作的,因此存在阻抗变异性。这种变异性可能导致测量的氧化电位发生轻微偏移,使得必须为每个电极精确定义对应于章鱼胺初级和次级峰的ROI。为了解决这个问题,采用了基于背景电容电流的原位预测方法。具体来说,识别由CFME表面醌类基团氧化产生的醌峰位置,并通过线性回归预测章鱼胺氧化峰的位置。预测值然后用于定义每个ROI窗口的中心,在电压维度上选择±50个数据点以产生100个点的窗口。每次FSCV扫描生成一个由850个数据点组成的伏安图。考虑到章鱼胺氧化峰的宽度,ROI在电压轴上设置为100个数据点。虽然完整数据集涵盖600个时间点,但时间窗口限制在300个时间点以捕获多巴胺和章鱼胺响应的主要衰减模式。因此,每个ROI被定义为300 × 100的矩阵。初级氧化峰周围的ROI被指定为第一个ROI(输入),次级峰周围的ROI被指定为第二个ROI(输出)。
对于数据采集,将碳纤维微电极和神经递质注射玻璃毛细管定位在蘑菇体的跟部或内侧尖端,以模拟体内神经递质释放。从11个电极共收集了226个颜色图(206个章鱼胺注射和20个空白),这些数据通过了噪声排除标准。这些数据用于训练深度学习网络,对应于第一个ROI的区域作为输入,第二个ROI的区域作为输出。
训练后,使用单独的多巴胺数据或多巴胺-章鱼胺混合物数据测试网络。与训练阶段一样,将多巴胺或混合物的第一个ROI作为输入提供给网络,以从输入中预测章鱼胺的第二个氧化峰响应。在只有多巴胺的情况下,第一个ROI中没有显著的章鱼胺信号,因此网络没有产生有意义的输出。相反,对于混合物数据,为了恢复原始的多巴胺信号,将预测的章鱼胺第二个氧化响应从混合物数据的第二个ROI中减去,从而估计多巴胺成分。
深度学习模型架构与训练
研究评估了三种深度学习架构:U-Net、ResNet18和LSTM,以从时间-电压-电流数据集中解析和量化多巴胺和章鱼胺信号。考虑到数据集规模不大,选择了一些已知在小数据设置下表现良好的架构,例如LSTM,以及ResNet和U-Net,它们已成功适应此类条件并能捕捉空间和时间模式。每个模型使用针对其架构单独优化的超参数进行训练,包括训练周期数、批次大小和其他设置以确保最佳性能。为了评估泛化性能,在未参与模型优化的未知混合物数据组成的留出测试集上计算了归一化均方根误差(NRMSE)。NRMSE计算为从混合物输入估计的多巴胺信号与真实多巴胺成分之间的差异。在测试的架构中,U-Net实现了最低的NRMSE,并产生了在视觉上与目标输出最一致的结果,使其成为此应用最合适的模型。
U-Net配置为输入尺寸128 × 128 × 1,编码器深度为4。虽然原始输入和输出数据形状为300 × 100,但都将大小调整为128 × 128以匹配网络配置。推理后,预测的输出被重新缩放回300 × 100以匹配原始分辨率。虽然U-Net最初是为分割任务设计的,但在此研究中被修改用于回归。具体来说,最终的卷积层被调整以产生单个输出通道,分割层被回归层取代。移除了softmax层,最终的卷积层直接连接到回归输出。模型训练最多40个周期,迷你批次大小为16。采用分段常数学习率计划,每10个周期将学习率减半以确保稳定收敛。
LSTM、ResNet18和U-Net模型的简要描述在支持信息中提供,同时提供了每个模型16个样本案例的代表性结果,以说明其输出的视觉差异。这些例子突显了定量指标未能完全捕捉的性能特征,例如伪影抑制、空间一致性和峰值形状准确性。虽然归一化均方根误差值在不同模型间相似,但定性差异是明显的。LSTM模型由于其基于序列的架构,偶尔表现出空间不稳定性。ResNet18模型虽然空间上更稳定,但产生了低分辨率输出,带有阶梯状伪影,并在无噪声区域产生不期望的信号。相比之下,U-Net模型更有效地保留了空间细节和时间连贯性,而没有引入此类伪影。这些优势可能源于U-Net的跳跃连接结构,它允许在重建过程中保留来自较早层的细粒度信息。因此,支持信息中的图表作为重要的定性验证,补充了定量评估。它们提供了伪影模式、不一致性和重建质量的视觉证据,这些可能无法完全反映在RMSE中。基于这些观察,U-Net被选为此研究的最终模型。
网络验证与混合物分析
考虑到相对较小的数据集大小,存在过拟合的风险,这可能会损害对未见数据的泛化能力。为了缓解这一点,采用了5折交叉验证来严格评估模型的泛化性能。数据集被随机分成五个相等的子集,在每次迭代中使用四个子集进行训练,一个子集进行验证,确保每个样本恰好作为验证数据一次。对于每一折,基于z-score归一化数据计算训练集和验证集的归一化均方根误差。平均而言,训练NRMSE为0.097 ± 0.10,验证NRMSE为0.082 ± 0.07,表明模型性能一致,没有过拟合迹象。这一趋势得到了进一步支持,该图显示在训练期间排除测试电极会使多巴胺的平均NRMSE从0.078增加到0.120,章鱼胺从0.092增加到0.140,反映了在更严格的测试条件下性能有适度但可接受的下降。这些发现支持了模型的鲁棒性及其在不同电极间泛化的能力。
为了在交叉验证之外进一步验证模型的泛化能力,评估了其在不同于训练分布的数据上的性能。首先,测试了计算混合物,这些混合物是通过数学结合独立的多巴胺和章鱼胺记录在计算机中生成的。使用计算混合物的一个关键优势是可以获得真实的多巴胺和章鱼胺成分,从而能够对信号分离进行定量评估。算法被设计为使用第一个ROI作为输入,预测混合物第二个ROI内的章鱼胺成分。通过从原始混合物中减去预测的章鱼胺信号,也可以恢复多巴胺成分。对颜色图和峰值电流时间过程的视觉检查进一步支持了网络的预测能力。为了定量评估分离性能,将用于生成混合物的原始章鱼胺和多巴胺信号视为真实参考,从而可以计算每个成分的NRMSE。所提出的算法对多巴胺的NRMSE为0.06,对章鱼胺为0.08,表明分离精度高,误差远低于10%。这些结果证明了所提出方法在分解重叠神经化学信号方面的有效性和可靠性。
在计算混合物上验证模型后,使用实验测量的由多巴胺和章鱼胺以1:1浓度比组成的混合物进行了额外测试。与计算混合物不同,实验混合物无法获得真实信号,因此无法与真实的多巴胺或章鱼胺成分进行数值比较。因此,通过视觉评估和定量相似性指标,通过比较预测信号与参考记录来评估分解质量。计算了预测颜色图和参考颜色图之间的结构相似性指数(SSIM)值,多巴胺为0.77 ± 0.06,章鱼胺为0.75 ± 0.10,表明尽管存在生物变异性,但结构一致性高。当将混合物注射到大脑中时,需要用填充有混合物溶液的注射毛细管替换原来的毛细管。因此,由于电极与新定位的注射毛细管之间的距离差异,测量的浓度和局部环境不可避免地存在轻微变化,所以没有真实值可供比较。为了量化混合物中预测的多巴胺和章鱼胺浓度,将从未纯分析物获得的事后校准数据应用于分离后的信号。因为每种混合物以1:1的浓度比制备多巴胺和章鱼胺,预测值预计应沿着恒等线分布。相应地,使用散点图评估每个成分预测峰值电流之间的一致性,在来自四个电极的25个混合物样本中显示出强相关性。为了评估超出相关性的的一致性,进行了Bland-Altman分析。该方法即使在相关性高的情况下也能解释潜在的系统偏差,并显示大多数数据点落在95%一致性界限内,支持模型在不同样本间的一致性能。这些结果表明,所提出的网络成功分离了计算和实验测量的混合物中的多巴胺和章鱼胺成分,预测误差保持在可接受的噪声范围内。
结论
研究开发了一种改进的基于U-Net的回归模型,用于分离快速扫描循环伏安法(FSCV)中重叠的多巴胺(DA)和章鱼胺(OA)信号。该模型在体内注射数据上训练,能够从其初级氧化信号准确预测章鱼胺的次级峰,并将其从混合物中减去以分离多巴胺成分。使用计算合成的混合物进行验证,NRMSE值低于10%,显示了高信号分离精度。当应用于实验测量的多巴胺-章鱼胺混合物时,模型在预测的多巴胺和章鱼胺浓度之间实现了强一致性,并且具有高结构相似性,尽管存在生物变异性。该模型在训练期间排除的电极数据上也保持了可接受的性能,预测误差通常低于15%。这些结果突显了该模型在解析重叠的、时间依赖的伏安信号方面的有效性,并表明其在黑腹果蝇大脑中其他动态电化学传感挑战中具有更广泛的应用潜力。