《Swarm and Evolutionary Computation》:A novel plug-and-play meta-black-box optimization module based on video streams for non-contact physiological signal extraction
编辑推荐:
非接触式生理信号监测技术rPPG面临运动伪影和参数优化难题,本研究提出DQPCA-TARE框架,创新性地融合生物流体动力学与强化学习,开发DQPCA元黑盒优化器动态平衡探索与利用,设计TARE模块通过傅里叶变换重构时空特征,并构建多约束评估函数实现无监督优化。实验表明该框架在CEC2017基准测试中以89.66%胜率超越11种SOTA优化器,在PURE和MMPD数据集上使5种主流rPPG模型MAE平均降低42.1%。
彭勇|顾少伟|吴国华|梁云斌|欧阳开晨|梁喜峰|王奎|范朝杰
中国湖南省长沙市中南大学交通与运输工程学院,教育部交通安全重点实验室,邮编410075
摘要 远程光体积描记法(rPPG)实现了非接触式的生理监测,但在复杂的真实世界场景中仍面临运动伪影和参数优化等重大挑战。为了解决这些问题,本研究提出了一种全新的即插即用框架DQPCA-TARE,其主要贡献包括:(1)基于血液动力学的元黑盒优化器DQPCA(双Q学习压力循环算法),该算法通过雷诺数调整探索与利用的关系,并通过动态流体参数调整避开局部最优解;(2)TARE(时间自适应残差增强)模块,该模块通过频域解耦和可学习的残差融合重建长距离时间相关性并优化特征;(3)无标签的复合目标函数,该函数结合信噪比、光谱一致性和稳定性约束来指导优化过程。广泛的评估表明,DQPCA在CEC2017基准测试中的胜率为89.66%,优于11种现有的最先进优化器。在PURE和MMPD数据集上,DQPCA-TARE在4种不同场景中持续提升了5种主流rPPG模型的性能,平均绝对误差(MAE)最大降低了85.87%。这些结果证实,所提出的框架在鲁棒性和泛化能力方面优于现有方法,尤其是在具有挑战性的跨数据集评估中。代码可访问地址:
https://drive.mathworks.com/sharing/a010b1c4-c049-44f9-9322-6a55c54d8d08 。
引言 随着现代医疗系统向数字化和远程化的转变,非接触式生理信号监测技术受到了学术界和工业界的越来越多的关注[1]、[2]、[3]。在这些技术中,远程光体积描记法(rPPG)作为一种极具前景的非侵入性技术,能够利用标准RGB相机捕捉面部皮肤的微妙颜色变化[4],从而估计心率(HR)和血容量脉动(BVP)等关键生理指标[5]。与传统接触式传感器(如心电图贴片或手指夹式脉搏血氧仪)相比,rPPG不会给受试者带来不适或干扰[6]。它在临床健康监测[7]、新生儿监测[8]和驾驶员状态监测[9]等场景中显示出显著的应用优势和便利性,为实现全天候人类健康监测提供了可行的途径。
rPPG的发展主要经历了从基于先验的方法向数据驱动方法的转变。早期的rPPG研究主要遵循传统的信号处理工作流程[10],即使用离散傅里叶变换(DFT)和峰值检测等方法处理面部感兴趣区域(ROI)的RGB信号来估计心率信号。然而,这些方法严重依赖复杂的手动特征工程,在面对运动伪影和复杂光照条件时缺乏足够的鲁棒性[11],难以满足临床应用的高稳定性要求。随后,以卷积神经网络(CNN)为代表的深度学习(DL)方法迅速成为该领域的主流,因为它们具有强大的特征拟合能力[12]、[13]、[14],显著提高了静态场景下的测量精度。值得注意的是,现有的深度学习模型通常采用固定的预处理流程或端到端的静态映射,缺乏动态适应特定环境噪声(如时间信号漂移或非刚性变形)的能力[15]、[16]。
当模型加入额外的信号增强模块来对抗这些干扰[17]时,会出现新模块内部参数与最终提取的生理指标之间的关系非线性且缺乏明确映射的问题。同时,模型的输入信号包含由设备因素引起的不可避免的测量噪声,导致新模块的参数与原始神经网络的参数在功能上存在显著差异。这些问题意味着,一方面,这种复杂的黑盒特性使得传统的梯度下降方法难以有效解决新模块参数与输出之间的映射关系[18];另一方面,直接应用原始网络的学习率等超参数无法满足新模块的更新需求。同时,值得注意的是,目前rPPG领域的研究主要集中在轻量级或高精度的端到端网络设计上,而重要的黑盒优化领域却被忽视了。因此,迫切需要一种无需显式梯度即可适应输入信号特定噪声特性的自适应优化策略。
为了解决这些挑战,我们设计了一种即插即用的优化框架DQPCA-TARE,该框架能够智能感知搜索环境,无需先验知识,并能自适应调整输入特征。该框架的核心设计理念是构建一个闭环自适应系统。它利用双Q学习(DQL)策略驱动的元优化器来指导时间自适应残差增强(TARE)模块,以自适应调整输入信号的频域特征。该框架采用了一个不需要真实值作为指导的评估函数来抑制特征漂移,并为模型提供高质量的输入。这使得模型能够在面对不同应用场景时自适应调整最优输入特征,从而显著提高模型在未知领域的鲁棒性和泛化能力。
本研究的主要贡献总结如下:
• 频域解耦增强: 我们设计了TARE模块,该模块利用快速傅里叶变换(FFT)将视频特征投影到频域。与标准空间滤波器不同,TARE通过可学习的残差融合机制动态重组低频结构和高频细节,有效恢复长距离相关性并抑制信号漂移。
• 新型元黑盒优化器: 我们引入了DQPCA,这是一种将生物流体动力学与强化学习理论相结合的先进优化策略。通过使用哈根-泊肃叶方程构建压力循环系统,并通过DQL调整参数,DQPCA在CEC2017基准测试中的优化性能显著优于11种现有主流优化器。
• 无需真实值的自适应框架: 我们构建了DQPCA-TARE框架,该框架由一个专门的评估函数指导,该函数结合了信噪比(SNR)、幅度一致性和稳定性正则化。这使得无需监督即可搜索最优输入特征权重。广泛的内部数据集和跨数据集评估证明,该框架在4种不同场景中显著提升了5种主流rPPG模型的性能,显示出比现有最先进方法更优越的泛化能力。
本文的其余部分安排如下。第2节回顾了rPPG测量和黑盒优化算法的相关工作。第3节详细描述了所提出的DQPCA-TARE框架,包括TARE模块的架构和DQPCA优化策略。第4节介绍了实验设置、内部数据集和跨数据集评估的结果以及全面的消融研究。最后,第5节总结了本文并讨论了未来研究的潜在方向。
章节片段 远程光体积描记法(rPPG) 基于视频的非接触式生理信号监测技术起源于Verkruysse等人的开创性研究[19],他们首次证明了使用标准RGB相机捕捉环境光反射来恢复光体积描记法(PPG)和血容量脉动(BVP)信号的可行性。现有的rPPG信号估计方法大致可以分为两类:传统信号处理方法和基于深度学习的方法。
传统方法
灵感 rPPG捕获的血容量脉动信号本质上是由压力循环系统中的压力梯度驱动的宏观流动映射。在生物物理学中,血液循环被定义为一种由压力势能驱动的复杂流体传输系统[54]。心脏作为系统的动力源,推动血液在复杂的血管网络中循环。血液首先被泵入主动脉和大型动脉;这一阶段被称为分布区,
数据集、基准测试和性能指标 为了全面评估所提出模块的有效性,我们将实验分为两部分:数值优化实验和rPPG估计任务。
对于数值优化实验,我们使用在优化领域广泛认可的CEC2017基准测试套件[58]来评估DQPCA的优化性能。为了进行全面比较,我们选择了11种最先进的优化器作为基准,包括9种经典优化器
结论 在这项研究中,我们提出了一个全新的即插即用框架DQPCA-TARE,以应对基于视频的生理信号提取中的运动伪影和参数优化问题。我们开发了一种基于血液动力学的元黑盒优化器DQPCA,该优化器成功利用雷诺数机制平衡了全局探索和局部利用,并结合双Q学习实现了动态参数调整。此外,我们设计了TARE模块来重建
CRediT作者贡献声明 彭勇: 撰写——原始草稿,正式分析,数据整理。顾少伟: 撰写——原始草稿,方法论。吴国华: 监督,方法论,调查,概念化。梁云斌: 撰写——原始草稿,数据整理。欧阳开晨: 撰写——原始草稿,正式分析,数据整理。梁喜峰: 监督,资金获取。王奎: 监督,数据整理。范朝杰: 撰写——审稿与编辑,撰写——原始草稿,监督,
代码获取 代码可以从摘要中的链接下载,或联系任何作者获取。
利益冲突声明 作者声明以下可能的财务利益/个人关系可能被视为潜在的利益冲突:合著者吴国华是该期刊的副主编。鉴于他的这一角色,他没有参与本文的同行评审,也没有访问有关其同行评审的信息。本文的编辑过程完全由另一位期刊编辑负责。
如果还有其他作者,他们声明没有已知
致谢 本文档是中国国家自然科学基金(U24B20123)、中南大学研究生创新项目(2024XQLH095)和中国湖南省(2025JJ60279)资助的研究项目的成果。