
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ICU记录的临床情感分析:一个数据集以及词库方法与临床语言模型方法的比较
《BMC Medical Informatics and Decision Making》:Clinical sentiment analysis of ICU notes: a dataset and a comparison of lexicon and clinical language model methods
【字体: 大 中 小 】 时间:2026年05月20日 来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
``` 摘要 背景 研究发现,通用领域的 sentiment 模型在区分重症监护室(ICU)临床笔记中的积极情绪和消极情绪方面效果不佳,因此推荐使用特定领域的 sentiment 模型。尽管有多种常见的 sentiment 分析方法,但很少有研究比较和
研究发现,通用领域的 sentiment 模型在区分重症监护室(ICU)临床笔记中的积极情绪和消极情绪方面效果不佳,因此推荐使用特定领域的 sentiment 模型。尽管有多种常见的 sentiment 分析方法,但很少有研究比较和评估专门化模型的有效性,这主要是由于招募临床注释者和获取临床 sentiment 数据的难度较大。本研究有三个贡献:(1) MIMIC-III-Ext-Notes-Sentiment: 首个由临床医生标注的公开 ICU 特定真实数据集,用于研究 ICU 临床笔记中的临床 sentiment 极性。(2) SentimentICUModel: 一种在真实数据集上有效分类 ICU 叙述中临床 sentiment 的模型。(3) 对该数据集上多种临床 sentiment 分类方法的有效性进行了对比分析。
我们招募了五名临床医生对笔记进行标注以生成真实数据。注释者指出了影响他们分类的笔记文本部分。六种特定于临床的模型在真实数据集上进行了对比。
由于临床医生的工作量较大,注释任务具有挑战性,整个过程持续了 15 个月。真实数据是基于注释者之间的共识分析得出的。临床医生提取的文本片段与其共识水平相符。临床语言模型提供了相当的准确性(最高可达 82%),其中 ClinicalT5 获得了最高分数,并以 SentimentICUModel 的形式发布。它们的表现优于基于关键词的词典(p\( < 0.05\),[95% CI, ?0.47, ?0.28])。
临床语言模型在识别临床笔记中的临床 sentiment 方面表现出有效性,能够早期发现患者的病情突然变化,并探索患者在 ICU 住院期间的不同模式。
研究发现,通用领域的 sentiment 模型在区分重症监护室(ICU)临床笔记中的积极情绪和消极情绪方面效果不佳,因此推荐使用特定领域的 sentiment 模型。尽管有多种常见的 sentiment 分析方法,但很少有研究比较和评估专门化模型的有效性,这主要是由于招募临床注释者和获取临床 sentiment 数据的难度较大。本研究有三个贡献:(1) MIMIC-III-Ext-Notes-Sentiment: 首个由临床医生标注的公开 ICU 特定真实数据集,用于研究 ICU 临床笔记中的临床 sentiment 极性。(2) SentimentICUModel: 一种在真实数据集上有效分类 ICU 叙述中临床 sentiment 的模型。(3) 对该数据集上多种临床 sentiment 分类方法的有效性进行了对比分析。
我们招募了五名临床医生对笔记进行标注以生成真实数据。注释者指出了影响他们分类的笔记文本部分。六种特定于临床的模型在真实数据集上进行了对比。
由于临床医生的工作量较大,注释任务具有挑战性,整个过程持续了 15 个月。真实数据是基于注释者之间的共识分析得出的。临床医生提取的文本片段与其共识水平相符。临床语言模型提供了相当的准确性(最高可达 82%),其中 ClinicalT5 获得了最高分数,并以 SentimentICUModel 的形式发布。它们的表现优于基于关键词的词典(p\( < 0.05\),[95% CI, ?0.47, ?0.28])。
临床语言模型在识别临床笔记中的临床 sentiment 方面表现出有效性,能够早期发现患者的病情突然变化,并探索患者在 ICU 住院期间的不同模式。
生物通微信公众号