《Scientific Data》:A Four-Wavelength Photoplethysmography dataset for non-invasive hemoglobin assessment
编辑推荐:
本研究旨在解决有创血液检测难以满足实时、可扩展血红蛋白(Hb)评估需求的问题。研究人员构建了名为Hb-PPG的四波长光电容积脉搏波(PPG)数据集,该数据集包含252名成年受试者在660、730、850、940?nm波长下的PPG信号,并同步采集了血红蛋白、空腹血糖、臂动脉收缩压与舒张压等参考测量值。这项工作为开发与验证无创血红蛋白估计算法提供了高质量基准,推动了无创血液监测技术的发展,具有重要的科研与转化医学价值。
血红蛋白(Hemoglobin, Hb)是我们身体中不可或缺的“氧气运输车”,其浓度是诊断贫血、评估心血管健康状况的一项基础生理指标。长期以来,准确测量血红蛋白浓度依赖于传统的静脉抽血化验,这种方法虽然精准,但过程具有侵入性,需要专业的实验室设备和人员,无法实现随时随地、持续动态的监测。这对于偏远地区医疗资源匮乏的场景,或是需要长期、频繁监测的患者(如慢性贫血、肾病、癌症患者)来说,无疑带来了诸多不便和高昂的成本。那么,能否像智能手表监测心率一样,通过一种简单、无创的方式来估测血红蛋白水平呢?这正是当前数字健康与生物医学工程领域的热点研究方向之一。
为了回答这一问题,一项名为“Hb-PPG”的研究应运而生,其成果已发表在《Scientific Data》期刊上。这项研究的核心目标,是为开发无创血红蛋白评估技术提供一块高质量的“试金石”——一个标准化的、多波长的、带有临床金标准参考值的数据集。研究人员深知,光电容积脉搏波(Photoplethysmography, PPG)技术潜力巨大,它通过皮肤照射光线并检测反射或透射光强的变化来捕捉血液容积的脉动信息,早已广泛应用于心率、血氧饱和度等生命体征的日常监测。不同波长的光对血液中不同成分(如氧合血红蛋白、还原血红蛋白)的吸收特性各异,理论上蕴含着丰富的血液成分信息。然而,缺乏一个包含多波长PPG信号与精确血液指标同步测量的公开数据集,严重制约了基于PPG的无创血红蛋白估计算法的开发、验证与比较。
为了构建这样一个宝贵的数据集,研究人员开展了一项涉及252名成年志愿者的横断面研究。他们利用定制的四波长PPG采集设备,同步记录了每位受试者在660、730、850、940 nm四个特定波长下的PPG信号片段。与此同时,严格遵循临床标准,为每位受试者采集了静脉血样,用于测量精确的血红蛋白浓度和空腹血糖水平,并测量了臂动脉的收缩压与舒张压作为血流动力学参考。最终,他们成功构建了Hb-PPG数据集,其中包含了1008个PPG信号段及其对应的临床参考值,为科学界提供了一个研究波长依赖性PPG信号特征及其与血液学、血流动力学参数关联的系统性资源。
这项研究主要采用了以下关键技术方法:首先,研究团队设计并应用了定制化的四波长PPG信号采集系统,实现了在660、730、850、940 nm四个近红外与红光波长的同步光学信号捕获。其次,他们构建了一个包含252名成年受试者的研究队列,并严格同步采集了每位参与者的PPG信号和临床参考指标。最后,通过标准化的临床检验流程,获取了血红蛋白浓度、空腹血糖以及臂动脉血压等精确的实验室与临床测量值,作为算法开发和验证的“金标准”。
关于数据集本身,Hb-PPG数据集提供了高质量、多波长的原始PPG信号,每个信号段都带有精确的时间戳和对应的采集波长信息。这使得研究人员能够深入分析在不同波长下,PPG信号的波形、幅度、频谱等特征如何随血液成分的变化而改变。
关于波长依赖性的初步分析,虽然摘要未详述具体分析结果,但该数据集的设立本身就是为了支持对波长依赖性PPG特征的研究。通过对比同一受试者在四个不同波长下的PPG信号,可以探究光学路径长度、组织吸收特性以及血液中不同成分(特别是氧合血红蛋白与还原血红蛋白)对不同波长光的吸收差异,这些差异是建立无创血红蛋白估计物理或数学模型的基础。
关于与生理参数的关联潜力,该数据集将光学信号与血红蛋白、血糖、血压这三类关键生理参数进行了配对。这为开发多任务学习模型、探索PPG信号在综合代谢与心血管健康评估方面的潜力提供了可能。例如,可以研究PPG信号特征是否与血糖波动或血压变化存在相关性,从而拓展无创监测的疾病谱。
归纳研究的结论与讨论,本项工作成功创建并公开发布了Hb-PPG数据集。这个数据集的核心价值在于,它首次系统性地提供了四个特定波长的PPG信号与精确血液学、血流动力学临床测量值的配对信息,填补了该研究领域高质量基准数据资源的空白。它不是一个直接用于临床诊断的工具,而是一个旨在推动方法学进步的科研基础设施。其重要意义体现在多个层面:首先,它为全球的研究人员开发、验证和比较各种基于PPG的无创血红蛋白估计算法(无论是基于经典特征工程与机器学习,还是基于端到端的深度学习)提供了一个公平、统一的基准平台,有望加速算法的迭代与优化。其次,数据集所涵盖的多波长信息,能够支持对光与生物组织相互作用的机理进行更深入的探索,有助于从原理上优化光学传感方案。最后,除了血红蛋白,数据集包含的血糖和血压参考值也为其在更广泛的代谢与心血管健康无创监测研究中的应用打开了大门,具有重要的转化医学前景和推动便携式、可穿戴健康监测技术发展的潜力。