引言:从结构到功能的认知深化
长期以来,消化系统疾病的诊断主要聚焦于结构性病变的识别。然而,临床上大量有明显消化道症状的患者,其结构检查却显示无异常。功能性胃肠病(FGIDs)的全球患病率高达20%–40%,构成了不可忽视的公共卫生挑战。传统的“排除法”诊断流程不仅延长诊疗周期、增加医疗成本,也给患者带来了不必要的生理与心理负担。近年来,随着对胃肠动力障碍、内脏高敏感性及脑-肠轴失调等病理机制认识的深入,胃肠道功能评估的临床价值日益凸显,其角色已逐渐从过去的辅助手段,转变为现代消化疾病诊断体系的核心组成部分。
然而,传统胃肠道功能评估技术的临床推广长期受限于多重现实障碍。虽然胃排空闪烁扫描(GES)被视为评估胃排空功能的“金标准”,但其涉及放射性核素使用,检查过程长达4小时,存在辐射暴露风险,且对专业设备和人员依赖性强。胃内球囊测压和食管高分辨率测压(HRM)等技术虽然能提供丰富的生理信息,但因其显著的侵入性,对患者耐受性要求高,难以在常规诊疗中广泛应用。传统的体表胃电图(EGG)虽具有无创优势,但因信号微弱、易受干扰、空间分辨率低,其诊断效能不足,也未能成为主流临床实践。这些方法在诊断准确性与患者接受度之间存在显著的权衡,成为限制功能评估普及的关键瓶颈。
幸运的是,柔性电子、人工智能和远程医疗等新兴技术的发展,为突破这一困境带来了新机遇。本综述旨在从患者友好性的核心视角,系统回顾胃肠道功能评估技术从传统方法到无创创新的演变及其应用现状。
传统评估技术在患者友好性方面的局限
放射性核素成像的代价
GES作为评估胃排空功能的“金标准”,其安全性备受关注。检查中患者需摄入放射性物质标记的食物,有效辐射剂量约0.5–2.0 mSv,孕妇绝对禁忌,儿童因预期寿命长而长期风险更高,慢性病患者则需考虑重复检查的累积辐射暴露。从患者体验和可及性看,标准4小时方案要求患者在核医学科停留较长时间,且检查前的禁食和可能不合口味的标准化餐食会降低患者依从性。此外,该技术严重依赖昂贵的γ相机和专业技术人员,且仅能提供单一的胃排空率指标,无法涵盖胃调节、胃电节律或胃窦收缩等多维信息。近期的研究也显示,胃排空延迟与症状严重程度之间缺乏一致相关性,提示仅依赖单一排空参数可能不足以完全反映胃功能障碍的复杂性。
侵入性测压:信息深度与患者负担的权衡
侵入性测压技术体现了胃肠道功能评估中“优先信息深度”的策略。其中,胃内球囊测压是目前评估胃调节功能的参考标准,可精确定量胃底的餐后舒张反应。HRM则利用密集排列的压力传感器阵列,以高时空分辨率记录胃窦、幽门和十二指肠区域的收缩活动,为分析胃十二指肠的运动协调性提供丰富的生理信息。
然而,这类技术在临床应用中的患者耐受性面临巨大挑战。胃内球囊测压需要经口置入导管并留置数小时,导管经过咽部常引发明显的恶心甚至呕吐反射,使相当数量的患者难以完成检查。在儿童或对刺激高度敏感的个体中,操作常因不适而中断,有时甚至需要轻度镇静。因此,侵入性本身已成为其普及的主要障碍。从可及性角度看,侵入性测压不仅设备昂贵、操作繁琐,对数据解读者的专业能力要求也很高,总体门槛限制了其在常规临床环境中的应用,更多是作为研究工具而非面向广大患者的日常诊断方法。
传统无创尝试:体表胃电图的局限
在闪烁扫描的辐射暴露和测压的侵入性背景下,体表胃电图(EGG)曾一度备受期待,被视为无创评估胃功能的可行途径。该技术通过贴附于上腹部皮肤的电极记录胃的慢波电信号,旨在无创地反映胃电节律及其餐后变化。然而,由于技术固有的局限性,传统的EGG从未获得广泛的临床认可。它通常仅使用单通道或少数通道进行记录,空间分辨率低,难以区分胃体不同区域的电活动,更无法识别慢波传播方向的异常。此外,胃电信号本身幅值微弱,极易受心电图、呼吸运动、腹壁肌电图和体位变化等生理及环境因素的干扰,导致信噪比低。加之信号处理方法相对粗糙,结果解读高度依赖操作者的主观经验,进一步削弱了EGG的可重复性和客观性。
上述问题导致不同研究中EGG获得的指标与胃排空功能及临床症状之间的关联不一致。此外,不同中心在检测方案、参数定义和解读标准方面缺乏统一性,显示出显著的异质性。因此,尽管具有无创优势,EGG却因诊断效能不足而未能成为主流临床实践。
总而言之,传统的胃肠道功能评估技术往往为了追求诊断准确性,而不得不牺牲患者的舒适度、安全性和检查的可及性。而且,此类评估通常依赖于单次的院内检查,难以反映功能性胃肠病症状波动和生理变化的动态特征。因此,其在真实世界临床场景中的指导价值有限。正是这些局限性,驱动了以患者为中心的无创新型评估方法的探索与发展。
无创技术的突破
稳定同位素呼气试验的无辐射替代价值
稳定同位素呼气试验(13C呼气试验)是一种通过监测13C标记底物代谢后产生的13CO2呼出量来估算胃排空率的方法。该技术的主要优势在于高安全性和操作流程简单。作为一种稳定同位素,13C不产生电离辐射,适用于孕妇、儿童以及需要重复检查的慢性病患者。样本采集可在门诊甚至家中进行,降低了对医疗设施的依赖。临床研究表明,该检测与闪烁扫描法测得的胃排空时间具有良好的相关性(r = 0.73–0.82),对诊断胃轻瘫的敏感性为83%,特异性为81%。
然而,与闪烁扫描法类似,呼气试验主要反映胃排空速率,难以提供多维信息。此外,检测结果可能受肝脏代谢、肺通气及小肠吸收状态的影响。因此,对于肝硬化、慢性阻塞性肺疾病或短肠综合征等患者,解读结果时需要格外谨慎。不同商业平台在底物类型、试餐成分、采样时间和计算模型上的差异,也影响了跨平台的一致性和推广的统一性。
体表与可摄入技术的无创深度检测
体表胃电描记映射:从单点到全局的演进
体表胃电描记映射(BSGM)在EGG基础上进行了系统性技术升级,采用高密度电极阵列覆盖上腹部,结合先进的空间滤波和信号处理算法,可有效分离出来自胃的慢波信号与心电图、呼吸、腹壁肌电等伪影,从而实现胃慢波的频率、幅值、传播速度、方向和节律稳定性等多维量化。近年来,BSGM正逐步走向临床转化。Gastric Alimetry系统于2022年获得FDA 510(k)许可和CE认证。由O’Grady等人主导的国际专家共识进一步规范了电极放置方法、记录时长、标准化试餐方案和质量控制流程,为多中心应用奠定了基础。
BSGM全程无创、操作简便、设备便携,支持在门诊使用。不同于胃排空闪烁扫描等传统方法,BSGM直接记录胃慢波的电活动,并允许患者在检查过程中实时标记症状事件(如恶心或腹胀),从而将症状发生的时间点与当时对应的胃电模式精准关联。这一特点有助于缓解传统胃排空研究中症状与生理指标常相脱节这一常见问题。通过持续监测患者自然进食状态下的餐前餐后过程,BSGM不仅提高了评估的生态效度和临床实用性,也构建了更加以患者为中心的诊疗评估框架。同时,现代BSGM系统已从传统的EGG显著进化,通过集成自动化信号处理和标准化的临床表型识别流程,极大地简化了结果的解读。
然而,目前BSGM仍有若干局限。其监测范围仅限于胃,小肠和结肠的功能需通过其他手段评估。设备和一次性电极的成本相对较高,尚未广泛普及。现有的大部分诊断阈值源自小样本队列研究,其在指导个体化治疗选择和预测治疗效果方面的价值仍有待大规模前瞻性干预研究验证。
无线动力胶囊的全范围监测能力
无线动力胶囊(WMC)将pH、温度和压力传感器集成于一个可吞咽的胶囊中,随着胃肠道自然蠕动,在消化道腔内连续采集多模态生理数据。胶囊在胃排空后,腔内pH从酸性快速转变为中性;当胶囊通过回盲瓣进入结肠时,pH再次下降。利用这些特征性转折点作为生理标志物,可划分胃、小肠和结肠的通过时间,实现对整个消化道运动功能的分段评估。SmartPill曾长期主导该领域,但该产品已于2023年停产。作为新一代替代品,Atmo Gas Capsule于2025年获得FDA 510(k)许可,在继承原有传感功能的基础上,新增了实时监测腔内气体成分(包括氢气、二氧化碳和氧气)的能力,为评估肠道发酵活动和微生物代谢状态提供了新维度。
WMC的核心优势在于,仅需单次口服即可同步获取胃、小肠和结肠的通过信息。此外,整个监测过程不限制患者的日常活动,且无电离辐射暴露。然而,它不适用于存在吞咽困难、已知或疑似胃肠道狭窄、瘘管形成或近期接受过腹部手术的患者。临床实践中,偶尔会发生吞咽失败、设备信号中断或胶囊滞留的情况,极少数情况下需要内镜干预取出,但在胃肠道通畅的个体中,此类事件的发生率低于2%。
持续监测与远程评估方案的动态追踪价值
持续监测和远程评估利用可穿戴或便携设备,将生理数据的采集从医院延伸至患者的日常生活环境。目前,已有数类技术进入临床或预验证阶段。例如,可穿戴腹部声学传感器可以通过记录肠鸣音来反映肠道蠕动,并已获FDA批准用于术后肠功能监测,在预测肠梗阻方面准确率高达97%。基于智能手表等消费设备的心率变异性(HRV)分析也被用于追踪自主神经活动,有研究显示其可提前数周预测炎症性肠病的复发。此外,一些新兴平台尝试检测汗液中的炎症因子,尽管仍处于早期探索阶段,但展现了居家动态监测的潜力。
然而,此类解决方案在实际应用中仍面临多重挑战。体表采集的信号易受运动、佩戴松紧或环境干扰,数据质量在很大程度上取决于患者是否正确使用设备。同时,持续产生的大量数据缺乏统一的处理标准和临床解读阈值,导致解读效率低下。更重要的是,当前的监管体系尚未针对此类新型数字健康工具的有效性验证、数据安全性和临床整合路径建立明确的规范。因此,尽管远程持续监测契合功能性疾病动态变化的特点,但在技术可靠性、实用性和制度支持方面仍需进一步完善,方能真正落实到临床实践中。
目前,无创胃肠道功能评估已发展出各有侧重的技术路径,但它们普遍共享一个共同发展方向:过去依赖单一指标的做法正被多维生理信号的整合所取代,静态的快照式检测正逐步让位于对真实生活环境中胃肠道功能的长期动态监测。这一转变使得数据量和复杂性显著增加,远超传统人工分析的能力。高效处理并准确解读这些高维异构数据,已成为推动新技术真正融入临床实践的关键瓶颈,也使得智能化分析工具成为一项迫切需求而非可选方案。
人工智能与计算方法的整合
信号分析与诊断模式识别的算法创新
随着胃肠道功能评估技术向多维、连续、高密度数据发展,传统人工分析日益力不从心,推动了信号处理和诊断建模方法的快速迭代。在BSGM领域,研究者已开始应用卷积神经网络(CNN)和循环神经网络(RNN)来自动识别胃慢波的传播模式。例如,嵌入Gastric Alimetry系统的深度学习算法可以实时滤除心电图和肌电图等伪影,精确提取包括慢波频率、方向、节律稳定性在内的参数,将人工处理时间从数小时缩短至几分钟,显著提高了解读效率和结果一致性。实践表明,针对特定临床场景定制深度学习架构,可显著增强医疗人工智能在复杂生理信号中的解析能力。
无线动力胶囊可同步记录pH、压力、温度乃至气体成分等多种信号,孤立分析单一参数可能导致忽略不同生理维度间的异常关联。为此,研究者在机器学习中采用多模态融合策略,对多源信号进行联合建模,以识别复杂的功能障碍模式。同样,持续监测产生的长期数据远超人类分析能力,长短期记忆网络等时序模型已被用于挖掘疾病活动性变化的早期线索。
信号处理仍面临显著的技术挑战。由于EGG信号本身微弱,极易受心电图和肌电伪影干扰,常规分析中常有36.5%的记录时段被排除,严重限制了数据可用性。BSGM通过高密度电极阵列、个体化电极放置和自动化处理流程,有效提高了信号质量。同时,Calder等人开发的自动伪影检测算法与专家标注相比,灵敏度和特异性均超过95%,专家间Fleiss‘ Kappa一致性为0.82,表明算法解读具有较高的可靠性。初步研究已证明算法在提升诊断性能方面的潜力。但需注意,目前大多数研究仍基于回顾性或单中心数据,算法在不同设备平台和多样人群中的泛化能力尚不明确,亟需通过多中心前瞻性研究加以验证。
可解释性与临床决策支持的建设
无论算法多么先进,如果医生无法理解其判断依据,则难以临床应用。过去,许多AI模型如同“黑箱”,只提供结论而无理由。医生既无法确认结果的可靠性,在发生错误时也难以追溯。这种不透明性使临床实践和监管难以接受。目前,胃肠道功能评估领域的AI正转向可解释性发展:一些系统可显示对诊断影响最大的参数,一些则利用可视化技术标记模型关注的信号片段,将结论与“慢波频率降低”或“传播方向异常”等具体的生理变化联系起来。专家共识和监管指南也明确指出,算法输出必须以临床可理解的方式呈现,制造商需解释决策逻辑并持续监控性能。
然而,可解释性仅仅是走向临床实施的第一步。更为深刻的挑战在于,人工智能系统如何适应现实世界中高度异质性的医疗环境。在三级医院,高性能计算资源和专业技术支持相对充足。而在初级医疗机构,由于算力有限、网络条件差、专业技术人员短缺,依赖云端处理或频繁更新的技术往往难以落地。同时,当智能平台提示的信息与临床医生的诊断发生冲突时,目前尚缺乏标准化的程序来调和这种人机判断的差异。大多数系统仅提供辅助信息图谱,最终诊断仍由医生综合决定,但尚未建立有效的反馈闭环以持续优化模型的准确性。此外,这些系统的长期运行还涉及维护成本、数据安全和技术更新等问题。一旦技术支持终止或医院无力承担必要的升级费用,这些系统可能迅速过时。这些问题导致目前许多先进技术的应用仍停留在理论验证阶段,并未真正融入日常临床实践以改善患者治疗结局。
未来研究需要超越单纯追求算法精度,转向强调实际临床价值的设计理念。这意味着需要进行大规模前瞻性研究以验证技术的广泛适用性,开发适合资源受限环境使用的简化工具,建立可有效整合医生与计算机判断的规程,并通过公私合作等方式探索确保技术更新和服务可持续性的途径。只有这样,这些先进技术才能从实验室走向临床,成为既实用又可靠的医疗工具,实现从准确诊断到有效治疗的全面进步,从而切实改善胃肠功能障碍的诊疗现状。
从技术验证到临床决策:转化路径与实施挑战
从诊断准确性到临床效用
传统上,新技术的准确性常通过与所谓的“金标准”进行比较来评估,假设结果越一致,技术就越可靠。然而,在胃肠道功能评估领域,“金标准”本身也存在局限性。研究表明,闪烁扫描法测得的胃排空延迟与患者症状严重程度之间的相关性并不强。这意味着检查结果异常的患者可能症状不明显,而症状严重的患者检查结果可能正常。如果一个“金标准”脱离了临床现实,即使新技术能完美复现这些结果,其对临床决策的贡献也有限。
这些新技术正逐步在临床管理中展现其价值。近期的研究表明,基于BSGM的电生理分类可能有助于优化特定患者的治疗方案选择。不同于传统依赖症状、逐步尝试药物的方法,BSGM可以揭示胃慢波活动的特定异常模式,并将其与临床情况相关联。以胃轻瘫的治疗为例,当BSGM检测到胃窦慢波频率不稳定时,表明可能存在神经电活动紊乱,此时增加促动力药往往效果不佳,应优先考虑胃电起搏等神经调节疗法。如果慢波频率稳定但幅值降低、传导异常,则饮食调整策略可能更为合适。在慢性便秘的管理中,WMC可一次性测量各节段通过时间,区分是以胃排空延迟为主还是结肠通过缓慢为主,从而指导选择促动力药或分泌剂。这种基于通过模式的分层治疗策略已被纳入ACG胃轻瘫指南。
这种转变反映了技术验证思路的重要调整。根据Fryback和Thornbury提出的诊断技术评估模型,技术验证可分为五个层级:最低层级关注设备的技术效能和诊断准确性,即设备的稳定性及其区分疾病的能力;其上是依次递进的诊断思维效能、治疗效能和患者结局效能,分别考察检查结果是否能影响医生的判断、治疗方案的选择,以及最终是否能改善患者的健康状况。目前,大多数关于新技术的研究主要集中在前两个层级,但真正体现临床价值的是后三个层级。
未来对新技术的验证不应仅仅聚焦于测量结果的准确性,而应更全面地考量这种测量是否能协助医生做出更好的临床决策,并最终使患者能否从中获益。鉴于胃肠道功能评估领域的特殊挑战,如症状与检查结果常不匹配、功能状态波动大等,有必要采用多维度的评估方法,关注患者的个体纵向变化,并纳入患者报告结局数据,从而为超越传统诊断准确性的临床效用建立坚实的证据基础。
临床决策路径的整合
目前,已有部分医疗机构开始使用13C呼气试验替代闪烁扫描进行胃轻瘫的筛查。这一转变显著提高了检查的可及性和安全性,尤其对于孕妇、儿童以及缺乏核医学科设施的初级单位。Spiegel团队应用AGIS腹部声学监测对术后肠功能恢复进行实时评估,有助于手术团队及时发现肠功能恢复延迟的高风险患者。炎症性肠病(IBD)患者的心率变异性变化常早于临床症状出现,提示持续生理监测具有预警潜力。
这些实践揭示了新功能评估技术融入临床实践的两种主要路径。其一是分流:通过无创的初步筛查,帮助医生判断哪些患者需要进一步的侵入性检查,哪些可以直接开始经验性治疗,从而优化诊疗流程和资源配置。其二是监测:利用可重复、无创的方法动态追踪治疗反应或预测疾病活动性。然而,目前尚无充分证据表明功能评估结果能直接指导具体治疗方案的选择。例如,HRV监测在炎症性肠病中的预警潜力备受期待,但其是否能真正优化治疗时机、降低复发风险,尚需通过前瞻性随机对照试验验证。
实施与转化的现实障碍
即使一项技术通过了临床验证,也并不意味着它能顺利融入日常诊疗。以13C-螺旋藻