《Journal of Inherited Metabolic Disease》:Expert-Designed Fact Sheets and AI-Based Analysis of Patient Symptoms to Combat Diagnostic Delays in Inherited Metabolic Diseases
编辑推荐:
本综述系统性介绍了法国G2m罕见病网络发起的全国性举措:由67位专家撰写了48份针对特定遗传代谢病(IMD)或症状的一页式疾病概要单,旨在为全科医生和患者提供快速诊断参考。研究利用自然语言处理(NLP)工具,将其中4种IMD的概要单内容与Necker医院患者的真实临床表型进行对比验证,结果显示二者高度吻合。该工具可作为连接初级诊疗与专家中心的桥梁,未来将与诊断辅助软件及人工智能技术结合,共同应对IMD的诊断困境,缩短诊断旅程。
引言
罕见病影响着欧洲约2500万人,在法国约有300万患者,约占人口的4.5%。遗传代谢病(IMDs)虽然每种疾病都罕见,但作为一个整体,其包含超过1000种遗传性疾病,累计发病率约为1/800活产。在法国,约一半的罕见病患者无法获得明确诊断,平均诊断延迟长达5年。诊断游移被定义为从最初症状出现到确立明确诊断之间的时期,这对于IMDs等可治疗的罕见病而言至关重要,延迟诊断会造成严重的公共卫生挑战。
为应对此问题,法国实施了旨在减少罕见病诊断延迟的国家政策,具体体现在连续的国家罕见病计划中。卫生当局的目标是在患者就诊后1年内获得诊断,否则即称为诊断僵局。这些计划通过罕见病参考与能力中心,以及由“G2m”等罕见病网络进行协调,进一步构建了诊断路径。这些专业医疗网络促进了患者的协调护理,并为全科医生等医疗专业人员提供了识别和管理IMD的培训。最新的国家罕见病计划还推动了患者支持机制的建立、专用信息平台的发展,以及高通量基因组分析平台等先进诊断技术的普及,以克服诊断僵局。
本研究描述的工作代表了一种对抗诊断游移的新工具,可协助IMD的诊断,并能在与人工智能结合后供患者、医疗专业人员和医院使用。这将使患者更快地被转诊至专家中心,并更早获得适当治疗。
方法
本项目的目标是创建简洁易懂的疾病概要单,总结关键的临床症状:当结合常规生物学或影像学数据一同考虑时,这些概要单可以帮助临床医生和患者在诊断过程中导航,从而指向特定的IMD诊断,并鼓励其寻求专家会诊。
疾病的选择基于两个标准:一是涵盖急诊管理方案的疾病,二是具有特定治疗或管理方案的疾病。此外,我们还创建了基于症状的概要单,但由于这些症状尚未与特定疾病关联,我们没有将其整合到诊断概要单中,而是将其纳入了包含诊断决策树的急诊方案中。
每份“疾病”文件的初稿由法国G2m网络的医生起草,并参考了国家诊断治疗指南和文献检索。随后,由专门研究该特定疾病或症状的专家组对草案进行评审。共有67位IMD专家参与修订,其中包括43位临床医生和24位生物学家。来自其他罕见病网络的16位专家也提供了意见。在专家小组和患者协会最终批准之前,根据专家反馈进行了多次迭代。文件在分发前由专门的平面设计团队进行了精修。为确保所有文件的一致性,尽可能实施了任何重大更改。
为了基于患者队列评估这些概要单中描述的症状在现实生活中的出现频率,我们选择了四种IMD(见表1),并对诊断概要单的内容与在Necker医院诊断为这些IMD的患者的临床特征进行了详细比较。在此分析中,我们利用了Necker医院临床数据仓库中的自然语言处理工具,从患者的临床记录中自动提取表型。该平台汇集了在Necker医院就诊的约100万患者的电子健康记录衍生出的临床叙述和结构化数据。表型提取过程采用了结合基于字典方法和深度学习方法的混合策略,并包括检测所提取表型上下文(如否定和经历者)的能力。然后,我们确定这些表型是否明确包含在相应的诊断概要单中。为便于解释,我们将相似或相关的表型归类为更广泛的临床/生物学表型。此外,每个表型还根据受影响的生理领域,映射到器官或系统类别。我们还评估了从患者病历中提取的每个表型是否与已建立的知识库(如人类表型本体、OMIM和Orphanet)中的疾病相关联。在此过程中,我们不仅考虑了与疾病直接相关的表型,还包括了它们在HPO层级中的祖先术语。由于患者临床记录中的临床术语可能存在表达方式、同义词或粒度上的差异,一位专家审核了输出表格以确保比较的准确性。该分析使我们能够评估概要单在多大程度上捕捉了临床上相关信息,这些信息可能未在现有知识库中得到充分体现,从而深入了解了它们在真实临床环境中指导诊断和管理的实用性。
结果
已创建48份法语概要单,并被翻译成英文(见表2)。其中41份概要单涵盖了根据Saudubray等人分类的各类疾病,包括14份关于导致急慢性毒性化合物蓄积的蛋白质或糖类中毒障碍,9份关于由能量(ATP)产生或利用缺陷导致的能量缺乏障碍,以及18份关于由复杂分子合成或分解代谢障碍引起的复杂分子障碍。另外7份概要单涉及通常提示IMD的症状,并配有决策树。
关于疾病概要单,最初创建的文件以MPI-CDG为重点(见图1)。除了针对具体病理的调整外,疾病概要单的格式已标准化,设计为A4横版单页文档,从上至下阅读。每份概要单以疾病名称开头,随后是为便于理解文档而设的关键要点。临床表现通常按受累器官分类,以分栏形式呈现。临床方面之后,提供了用于调查临床异常的生物学检查或放射学检查的异常发现细节。随后,以问题形式重申标题,强调这些元素的组合应促使考虑该诊断并转诊至专家中心。下一部分概述了专家中心为确认诊断假设通常采取的专业诊断方法。虽然包含了一些具体管理方面,但有意保持简洁,因为全面的细节超出了诊断辅助的范围,可以在急诊方案、国家诊断治疗指南或其他专业资源中找到。概要单上标明了参考文献的超链接和联系方式。关于症状概要单,它们包含一个诊断树、需进行的主要检查,以及对出现该症状但尚未确诊的患者应实施的治疗。这些文件可在G2m网络网站上免费获取,为包括患者和非专科医疗专业人员在内的所有访客提供访问。
此外,这些资源中的信息已与从Necker医院随访的、患有四种IMD之一的患者的临床数据仓库中提取的表型数据进行了交叉验证。这四种疾病是:极长链酰基辅酶A脱氢酶(VLCAD)缺乏症、赖氨酸尿性蛋白不耐受症(LPI)、戈谢病和沃尔曼病。选择这四种疾病是因为它们涵盖了IMD的三个分组,并且我们认为其诊断延迟可能特别明显。在Necker医院识别的每种疾病的患者数量见表1。
患者的症状按受累器官分类,其出现频率记录在为这四种疾病创建的概要单中(见图2)。值得注意的是,症状发生率随年龄变化;例如,LPI的肺部和肾脏问题在晚年更常见,包含老年患者的研究可能会报告更高的发生率。
表3列出了从四种疾病患者记录中提取的最常见症状。我们的比较分析显示,这些常见症状通常既存在于现有知识库中,也存在于这四种疾病的诊断概要单中。两种来源都经常缺失的症状(既未在OMIM或Orphanet中与疾病关联,也未出现在我们的概要单中)往往是非特异性的常见症状,如发热、呕吐、腹泻和咳嗽。虽然这些症状在临床记录中经常被提及,但它们可能与这些IMD的诊断没有直接关系。它们可能代表了普通人群中常见的偶发事件,但可能是潜在代谢病患者代谢失衡的触发因素,因此在记录中被特别注明。总的来说,这表明概要单与知识库在捕捉真实世界临床数据中的关键诊断特征方面高度一致。我们的分析还发现,从真实世界患者数据中提取的表型,其粒度可能与OMIM和Orphanet等现有知识库中的编码方式不同。为应对这些粒度差异,我们利用了HPO层级结构来捕捉与每种疾病相关的具体表型及其祖先术语。尽管如此,一些同层级表型存在于患者临床记录中,但知识库中却没有。例如,Necker医院23例LPI患者中有11例报告的“厌食症”,未在OMIM或Orphanet中与LPI关联,后者列出的是其同层级表型“喂养困难”,而后者仅在2例LPI患者中被报告,这显示了“厌食症”在临床记录中的更频繁使用。类似地,Necker医院7例沃尔曼综合征患者中有5例记录的“腹痛”在知识库中缺失。知识库中存在的同层级表型是“腹部膨胀”,后者在患者记录和患者中也观察到。最后,Necker医院19例戈谢病患者中有8例报告的“乏力”在知识库中缺失。然而,HPO术语“疲劳”存在于戈谢病的数据库中,并注明了应将乏力与疲劳区分开,因为乏力是指在任何努力之前就出现的衰竭感。值得注意的是,诊断概要单包含了这些在实践中常用的、用于描述患者某些症状的具体术语。这突显了当前本体论在代表真实世界临床语言描述患者方面可能存在的局限性,并进一步强调了诊断概要单在提供全面且临床相关诊断视角方面的实用性。
此外,本研究强调了LPI中特定的心脏受累情况。事实上,通过将症状按受累类别分组,发现在Necker医院随访的23例LPI患者中,有12例至少有一种心脏受累症状,包括瓣膜病、心律失常、心脏扩大、心室肥厚和缺血性心肌病。
讨论
本文报告了G2m网络为对抗诊断游移而发起的一项倡议:创建了48份概要单,其中41份针对遗传代谢病领域的特定疾病或疾病组,7份重点关注通常提示IMD的症状。这些概要单通过包含总结临床症状的关键词以及常规生物学和/或影像学检查来促进诊断。为评估诊断概要单的准确性和相关性,我们选择了4种IMD,并使用自然语言处理工具从病历中自动提取患者表型,将其内容与Necker医院患者的临床特征进行比较。我们发现概要单与这些患者的真实世界临床数据高度吻合,尽管并非所有患者都具有全部这些症状;我们在图2中指出了这些症状在现实世界中的出现频率。
诊断游移发生在患者经历多次医疗咨询和诊断测试而未获得明确诊断时。这通常源于其病情的罕见性或认知有限,以及认为其症状不重要或主观的看法。当全科医生难以联系各种症状或未能考虑到需要转诊至专科中心进行进一步评估、确诊和定制治疗(包括创新疗法)的罕见病可能性时,就可能出现这种情况。通过在一页纸上提供清晰简洁的信息,包括应引起对各种IMD怀疑的基本临床症状和常见的放射学和/或生物学指标,这些概要单旨在成为非专科医生的宝贵资源。既然这些概要单已在G2m网站上免费提供,我们的计划是在全科医生和非代谢病专科医生的会议上进行展示,并将其链接到诊断辅助软件。已完成英文翻译,这些文件也可能在其他国家有用。例如,它们可以由欧洲参考网络分享,特别是MetabERN。最后,尽管这些文件是由多学科高度专业化专家小组与其他专业同事合作开发的,但未采用正式的方法来验证它们。计划在分发1年后收集用户反馈,并根据需要进行更新。有多种教育资源可用于向非专科医生介绍代谢病,包括国家指南、代谢病文献、书籍、科学出版物、视频以及由专家和患者协会举办的网络研讨会。然而,这些资源通常侧重于提供诊断后的信息。这里介绍的“诊断概要单”的独特优势在于,它们能从特定症状出发,快速有效地概述特定疾病,加之其快速且易于消化的格式,使其可供互联网上的患者和医疗专业人员访问。
诊断辅助软件也正在为医生开发,主要面向社区环境,但也供医院医生使用,并对患者免费开放。用户可以输入多个临床或生物学症状,软件会汇总数据,根据症状相关性提出可能的诊断。其中一个工具是“IEMbase”,这是一个针对IMD的专业搜索引擎。该软件允许用户输入关键的临床或生物学症状,识别潜在的IMD,并提供大量IMD专家信息的链接。然而,它并未涵盖其他罕见病之间可能的鉴别诊断,而且在实践中,这个工具似乎更服务于已经怀疑IMD或寻求专家见解的专业人士。第二个工具是Tekkare的“RDK”,这是一个可靠的诊断辅助工具,利用症状帮助医生识别病理,无论是代谢性的还是非代谢性的,同时还能定位相关的专家中心和罕见病网络。Orphanet作为罕见病和孤儿药信息的主要资源,提供了包括IMD在内的罕见病的详细信息,并具有基于症状诊断罕见病的搜索功能。由于我们的概要单是在2023–2024年间在法国IMD专家指导下制定的,它们将被用于增强旨在减少诊断延迟的各种软件工具,例如Orphanet平台和HPO代码,将这些数据集成到RDK应用中。
如上所述,我们对Necker医院患者病历与诊断概要单的比较分析结果验证了我们概要单的诊断价值,显示概要单与知识库在捕捉关键症状方面高度一致。我们概要单在收集临床相关信息方面的实用性也得到了强调。我们知道在真实世界数据中,患有某些症状的患者百分比。然而,由于诊断概要单中体征缺乏标准化编码以及粒度差异,精确量化和统计分析并不可行。因此,分析主要强调定性比较而非定量指标,限制了统计验证所捕获表型临床意义的能力。
有趣的是,在我们的研究中,对于一种疾病,对患者档案中记录的症状进行分析,揭示了一种通常与之无关的情况,表明LPI患者可能存在潜在的心脏受累。
尽管文献中报告了两例患者的心脏症状,但心脏受累作为LPI的具体表现,在医学界并未明确确立。在我们的记录中,心脏表现是异质性的。最常见的发现是瓣膜病,见于四例患者。其他发现包括缺血性改变(一例患者)以及一系列病症,如心律失常、心脏扩大和心室肥厚。因此,尽管是异质性的且有时是非特异性的,12例患者中存在多样化的心脏异常,这引发了关于LPI与心脏受累之间可能存在关联的问题。人工智能可能揭示最初发表的病例中未描述的症状或新的与年龄相关的症状;在LPI中,这一发现值得进一步研究,并可能鼓励临床医生筛查心脏受累。如果与疾病相关,心脏损害的机制尚不清楚,尽管提出的假设包括免疫缺陷和一氧化氮代谢异常。由于LPI的心脏受累尚未正式确立,且我们的概要单旨在作为关注该疾病核心公认特征的非专科医生的诊断辅助工具,我们未将其纳入概要单。
因此,在系统地将所有概要单与从医院病历中提取的表型数据进行比较后,特别是通过将临床和生物学表型与患者年龄和老龄化队列相结合,可以考虑进一步的更新。这些工具可能为了解老年患者的结局提供见解。
结论
这些“疾病”和“症状”概要单的创建是各中心、各学科专家在法国IMD网络“G2m网络”协调下合作的结果。这些概要单提供了关于IMD内罕见病的简洁资源,旨在通过突出转诊至专科中心的关键症状来解决诊断延迟问题。它们在G2m网站上免费提供,并即将更广泛地分发。我们的概要单将用作目前正在开发的人工智能工具的数据库,可直接在我们法国IMD网络的网站上访问,以促进IMD诊断。它们也可用于更新现有的罕见病诊断辅助软件。