预测医院床位占用率:一种基于 Prophet 时间序列模型的方法
《BMC Medical Informatics and Decision Making》:Forecasting hospital bed occupancy: a time series approach with prophet
【字体:
大
中
小
】
时间:2026年05月10日
来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
**摘要**
**背景**
准确的医院床位占用预测对于有效的资源规划和患者流动管理至关重要。尽管复杂的机器学习模型在医疗健康预测中越来越受欢迎,但由于维护成本高昂且可解释性有限,它们的实际应用效果往往不尽如人意。本研究评估了Prophet这一简洁的时间序列模型在中期医院床位
**摘要**
**背景**
准确的医院床位占用预测对于有效的资源规划和患者流动管理至关重要。尽管复杂的机器学习模型在医疗健康预测中越来越受欢迎,但由于维护成本高昂且可解释性有限,它们的实际应用效果往往不尽如人意。本研究评估了Prophet这一简洁的时间序列模型在中期医院床位占用预测中的性能和实用性。
**方法**
我们应用Prophet模型分析了弗莱堡大学医疗中心(2010-2023年)的每日床位占用数据,并将公共假日和COVID-19大流行指标作为外生回归变量纳入模型。Prophet将时间序列分解为趋势、季节性和假日效应这三个可解释的组成部分。通过2022-2023年的滚动交叉验证,我们对30天、60天、90天和180天的预测精度进行了评估。同时,我们还使用基于云的工具实现了一个可用于实际生产的预测流程和仪表板。
**结果**
Prophet在所有预测时间范围内都取得了较低的MAPE值(3.21%–3.53%),预测覆盖率超过80%,显示出与需要更高计算资源和运营成本的复杂模型(如深度神经网络)相当甚至更好的准确性。组件分析揭示了与医院运营相关的模式,包括周周期和年周期以及假日效应,这凸显了该模型的可解释性。
**结论**
研究表明,可以使用像Prophet这样的简单且可解释的模型来准确预测中期医院床位占用情况。与更复杂的架构相比,Prophet不需要大量调整,部署速度更快,并且能提供更清晰的洞察力,这在实际运营环境中至关重要。这些发现进一步证明了对于床位占用等结构化预测任务而言,简单模型不仅在准确性上可与复杂模型相媲美,在复现性、可扩展性和运营价值方面也同样具有竞争力。
**背景**
准确的医院床位占用预测对于有效的资源规划和患者流动管理至关重要。尽管复杂的机器学习模型在医疗健康预测中越来越受欢迎,但由于维护成本高昂且可解释性有限,它们的实际应用效果往往不尽如人意。本研究评估了Prophet这一简洁的时间序列模型在中期医院床位占用预测中的性能和实用性。
**方法**
我们应用Prophet模型分析了弗莱堡大学医疗中心(2010-2023年)的每日床位占用数据,并将公共假日和COVID-19大流行指标作为外生回归变量纳入模型。Prophet将时间序列分解为趋势、季节性和假日效应这三个可解释的组成部分。通过2022-2023年的滚动交叉验证,我们对30天、60天、90天和180天的预测精度进行了评估。同时,我们还使用基于云的工具实现了一个可用于实际生产的预测流程和仪表板。
**结果**
Prophet在所有预测时间范围内都取得了较低的MAPE值(3.21%–3.53%),预测覆盖率超过80%,显示出与需要更高计算资源和运营成本的复杂模型(如深度神经网络)相当甚至更好的准确性。组件分析揭示了与医院运营相关的模式,包括周周期和年周期以及假日效应,这凸显了该模型的可解释性。
**结论**
研究表明,可以使用像Prophet这样的简单且可解释的模型来准确预测中期医院床位占用情况。与更复杂的架构相比,Prophet不需要大量调整,部署速度更快,并且能提供更清晰的洞察力,这在实际运营环境中至关重要。这些发现进一步证明了对于床位占用等结构化预测任务而言,简单模型不仅在准确性上可与复杂模型相媲美,在复现性、可扩展性和运营价值方面也同样具有竞争力。
**背景**
高效分配医疗资源是全球卫生系统面临的核心挑战。特别是医院,在有限的基础设施和劳动力条件下,面临着满足日益增长的需求的压力。人口老龄化、慢性疾病发病率的增加以及疫情等意外冲击,都对医疗服务带来了持续的压力。在这种背景下,医院床位管理成为一个关键的运营问题。有效的床位管理与成本效益和护理质量密切相关[1, 2]。床位供应不足可能导致一系列负面后果,包括患者等待时间延长、护理质量下降[3],以及医院工作人员的压力和倦怠感增加[4]。这些挑战还因患者需求的不确定性而加剧,而患者需求受疾病发病率和健康危机爆发时间的影响。
医院床位需求和占用预测是一个涉及多个尺度和视角的话题。在战略层面,优化国家医院基础设施计划需要考虑巨大的空间和时间尺度[5, 6, 7]。在战术层面,数周到数月的中期预测对于劳动力调度和休假计划至关重要,以确保在需求季节性波动的情况下仍能提供持续的服务[8, 9, 10, 11]。在运营层面,几小时范围内的短期预测对于急诊科和重症监护病房的资源管理特别重要[12, 13, 14, 15, 16, 17]。为了应对这些挑战,准确预测医院床位占用情况已成为一个日益重要的研究领域[18]。
预测未来床位占用情况的方法大致可分为两类:间接方法和直接时间序列预测。间接方法涉及预测影响床位占用的关键因素,如患者入住情况和住院时长(LoS),然后结合这些预测来估计未来的床位需求或占用水平[19, 20, 21, 22]。这种方法通常需要详细的患者级别数据,并可能涉及复杂的LoS预测建模。相比之下,直接时间序列预测利用历史床位占用模式来预测未来水平,而不需要敏感的患者特定信息。这些方法的适用性取决于预测的时间范围。基于患者流动动态的间接方法通常适用于非常短期的预测。直接时间序列预测广泛应用于中期和长期预测。
现有关于床位占用预测的文献展示了多种建模方法的应用。传统的统计时间序列模型,如自回归积分滑动平均(ARIMA)[23]和季节性ARIMA(SARIMA)[14],已被用于捕捉床位占用数据的时间依赖性和季节性。基于回归的模型以及其他机器学习技术,如支持向量回归(SVR)[24, 25]和集成方法(如随机森林[24, 26, 27]、梯度提升[24, 26],也被用于预测床位需求和占用情况。这些模型通常结合各种外生因素以提高预测精度,并提供有关床位占用数据模式的宝贵见解。深度学习模型也被应用于医院床位占用预测,尤其是在模拟复杂非线性关系和时间动态方面。循环神经网络(RNN),特别是长短期记忆(LSTM)网络和门控循环单元(GRU),在捕捉床位占用的复杂时间依赖性方面表现出显著潜力[5, 10, 28, 29]。基于Transformer的模型也同样被使用[30, 31]。
尽管复杂的机器学习和深度学习模型在各种时间序列预测任务中表现出色,但它们的复杂性以及有时缺乏可解释性阻碍了其在临床环境中的实际应用。Prophet[32]是一种专门为预测具有多重季节性、趋势变化点和假日效应的时间序列而设计的广义加性模型,具有最小化的参数化和其分解成分的完全透明性。Prophet已被应用于各种医疗健康预测任务,包括患者入院和出院[33, 34]、传染病趋势[35, 36]以及医疗资源规划[37]。尽管Prophet在这些研究中的预测效果与其他方法相比参差不齐,但由于其可解释性、易用性和灵活性,它仍然具有吸引力。尽管相关研究较少,但Prophet在中期医院床位占用预测中的作用尚未得到系统性的研究。本研究通过评估Prophet在该领域的表现填补了这一空白。
此外,有效的操作化对于确保预测结果能够转化为医院员工和管理人员可操作的见解至关重要。虽然本研究的主要焦点是预测医院床位占用情况,但我们也特别关注了预测输出的运营整合。为了支持实际决策,我们实现了一个可用于生产的数据流程和特定角色的仪表板,使预测能够定期更新并可供相关利益相关者访问。尽管与数据基础设施、处理和交付平台相关的实施细节对于在临床和行政环境中实际使用预测结果至关重要,但它们通常在相关研究中被忽略。通过分享我们的数据基础设施和交付方法,我们旨在为提高预测模型的准确性和可操作性做出贡献。
**方法**
我们收集了弗莱堡大学医疗中心2010年1月1日至2023年12月31日的住院患者数据。数据集仅包含以下运营变量:位置标识符、入院时间和出院时间。未收集、处理或分析任何个人身份信息。为了将这些记录转换为适合预测的时间序列格式,我们将每日入住和出院人数汇总起来,得出每日床位占用情况。我们将每日床位占用定义为午夜时的占用床位数量。图1所示的时间序列代表了本研究中使用的每日床位占用情况。视觉检查显示多年来床位占用情况呈明显上升趋势,这可能与医院能力的逐步扩展和服务需求的增长有关。这一趋势在2020年COVID-19大流行初期被打断,当时床位占用率暂时下降,这与该期间 elective 护理的暂停和患者入院减少是一致的。除了这些长期趋势外,还存在着明显的季节性模式。在每周层面,工作日的床位占用率较高,周末较低,反映了工作日集中进行 elective 治疗的操作惯例,而周末由于员工可用性有限,活动减少且出院人数增加。在年度层面,重大节假日前后床位占用率显著下降,尤其是在圣诞节期间,医院活动大幅减少。这些描述性见解为建模策略提供了依据,包括考虑了弱季节性和年度季节性,并促使我们纳入了以下外生变量:
- **公共假日**:一个二元变量,表示是否存在公共假日,这些假日通常与医院入院和出院的变化相关。由于医院位于巴登-符腾堡州,我们使用了该州相关的国家和区域公共假日清单。
- **COVID-19大流行时期**:创建了一个特殊的一次性假日变量,以反映COVID-19大流行对医院运营的独特影响。该变量覆盖了2020年3月20日至6月30日的时期,有效标记了第一次大流行的封锁期,这对床位占用产生了显著影响。
**模型和预测方法**
为了预测每日医院床位占用情况,我们使用了Facebook(现为Meta)开发的Prophet。Prophet是一种广义加性模型(GAM),它将时间序列分解为趋势、季节性和假日三个组成部分,为具有复杂季节性模式的时间序列数据建模提供了强大的框架。这种结构与图1中观察到的模式直接一致,使得Prophet特别适合中期医院床位占用预测。Prophet可以表示为:
$$\:\text{y}\left(\text{t}\right)\hspace{0.17em}=\hspace{0.17em}\text{g}\left(\text{t}\right)\hspace{0.17em}+\hspace{0.17em}\text{s}\left(\text{t}\right)\hspace{0.17em}+\hspace{0.17em}\text{h}\left(\text{t}\right)\:+\:\varepsilon \left(\text{t}\right)$$
其中:
- $y(t)$ 表示时间t时的床位占用情况。
- $g(t)$ 代表趋势函数,用于模拟床位占用的非周期性变化。我们采用了分段线性趋势,以适应不同的增长率并识别趋势变化点。
- $s(t)$ 捕捉季节性变化,包括周周期和年周期。这些变化使用傅里叶级数进行建模,可以根据季节性复杂性的不同调整项数。我们将年度和周度季节性的傅里叶分量数量分别设置为10和3。h(t)模型用于模拟假期和特殊事件(如公共假期和COVID-19大流行期)的影响。通过将这些作为回归变量纳入模型,我们可以明确地考虑它们对床位利用率的影响。ε(t)是一个误差项,代表模型组成部分无法解释的特异性变化。误差项在正态性的参数假设下进行建模。为了生成预测区间,Prophet根据历史变化率在变化点处模拟未来的趋势变化。模型通过推断过去的变化率分布来预测潜在的未来趋势情景。初步的超参数调整是使用单独的验证集进行的,以评估Prophet关键参数(如变化点灵活性和季节性傅里叶项)的影响。然而,这些实验并未显示出比默认设置更高的改进。因此,为了保持模型的简洁性而不牺牲准确性,保留了默认的超参数。
为了评估预测性能,我们对2022年1月1日至2023年12月31日的两年期间进行了滚动交叉验证。这包括在数据的一个子集上训练模型,然后对接下来的30天、60天、90天和180天进行预测,并将这些预测与实际观察值进行比较。具体来说,我们采用了滚动起点评估方法。对于评估期内的每个日历月,模型都是从头开始使用2010年1月1日至该月开始的训练数据进行了训练。随后,生成接下来的30天、60天、90天和180天的预测。为了确保每个折叠的测试部分完全覆盖预测范围,我们根据预测范围更改了评估集的最终截止日期,从而得到了30天的24个折叠,60天的23个折叠,90天的22个折叠,以及180天的19个折叠。在这种设置下,给定折叠的训练集大小从2010年一直延伸到截止日期都是相同的,而测试集大小则由相应的预测范围决定。由于截止日期是按月间隔设置的,这种设计在折叠之间存在部分重叠。对于30天的预测范围,重叠最小;而对于60天和90天的预测范围,许多日期被预测了两到三次;而对于180天的预测范围,最多被预测了六次。当固定的预测范围超过折叠间隔时,这种重叠是滚动起点评估的自然属性。虽然这种重叠会导致各个折叠之间的性能指标出现相关性,但它不会偏倚模型性能指标的估计。
我们使用了以下指标来评估预测的准确性:均方根误差(RMSE)提供了一个可解释的误差标准差的度量。平均绝对误差(MAE)计算了误差的平均幅度,直观地展示了误差在原始测量单位中的规模。平均绝对百分比误差(MAPE)以百分比表示预测准确性,具体来说是预测值与实际值之间的平均绝对百分比差异。中位数绝对百分比误差(MDAPE)提供了绝对百分比误差中位数的视角,这在误差分布偏斜的数据集中特别有用。对称平均绝对百分比误差(SMAPE)是MAPE的一个变体,它确保了对过高和过低预测误差的平等加权,提供了预测准确性的平衡视图。最后,覆盖率通过计算实际值落在模型预测置信区间内的百分比来评估模型的可靠性。尽管Prophet正式假设残差呈正态分布,但在每日医院床位利用率的背景下,误差项可能不遵循精确的高斯分布,因为波动和偶尔的冲击(例如,非典型的入院增加或突如其来的疫情爆发)可能会产生不对称或重尾误差。为了获得统计上稳健的模型性能估计,我们在交叉验证期间生成的每个预测-观测对上应用了非参数自助法。这些对是带有替换的重采样,然后对每个自助样本重新计算性能指标。共生成了10,000个自助样本,将结果分布的2.5%和97.5%分位数作为95%置信区间的界限。通过直接从预测误差的经验分布中进行重采样,自助法提供了所有报告指标的一致点估计和不确定性的经验量化。这种方法通过提供无分布的不确定性量化来减轻非高斯残差行为的影响。
为了确保透明度和可重复性,用于生成本研究中报告的结果和图表的完整脚本集可以通过专用的GitHub仓库公开获取:https://github.com/mcuf-idim/bed-occupancy-forecasting-with-prophet。
为了确保端到端的可重复性和操作可靠性,我们开发了基于云原生技术的数据管道,这些技术负责原始入院数据和预测输出的摄取、验证、转换、存储和交付。高级工作流程图如图2所示。入住记录从医院信息系统摄取到ClickHouse [38]中,这是一个优化了高并发分析查询的列式OLAP数据库。摄取后,使用Great Expectations [2]对原始数据进行了模式和语义检查;任何违规都会触发自动警报,并在异常解决之前停止下游执行。随后,dbt模型 [3] 执行基于SQL的转换,将清理后的记录汇总为每日床位利用率计数。Prophet模型生成的预测被写回到ClickHouse中,并与历史利用率数据一起存储。将观察到的数据和预测数据整合在单一的分析存储中,简化了下游访问并确保了仪表板和分析输出之间的一致性。元数据模式使用MLFlow [4]捕获模型版本、执行时间戳和性能指标,从而支持可重复性并便于跨预测迭代进行比较评估。分析交付是通过Apache Superset [5]仪表板实现的,这些仪表板直接连接到ClickHouse数据存储。
这些管道由Argo Workflows [6]在Kubernetes集群上编排。每个任务都包括带有指数退避的超时机制,并使用不可变工件存储来确保临时故障不会损害数据完整性或审计跟踪。所有转换步骤都是版本控制的,并自动记录,生成了支持可追溯性的谱系图。整体工作流程遵循写-审计-发布的数据工程模式,如图3所示。
图2展示了医院床位利用率预测的高级工作流程图。该图说明了数据管道的关键阶段,包括从医院信息系统摄取数据到ClickHouse,使用Great Expectations进行数据验证,通过dbt模型进行数据转换,使用Prophet模型生成预测,以及通过Apache Superset仪表板进行分析交付。
模型组件分析:将Prophet模型拟合到其组成组件后,可以提供关于驱动医院床位利用率的潜在模式的宝贵见解。如图4所示,模型揭示了明显的趋势、假期效应、周度季节性和年度季节性。趋势组件反映了原始数据中的长期增长,包括COVID-19大流行期间的急剧下降以及随后的恢复。假期组件捕捉了特定事件对床位利用率的影响。正如预期的那样,公共假期导致利用率明显下降,证实了这些时期活动减少的观察结果。在大流行期间观察到了最显著的负面影响。这突显了大流行造成的重大干扰,其影响比普通的公共假期更为明显。周度季节性组件再现了工作日与周末之间的明显周期,捕捉到了工作日较高的利用率和周末较低的利用率。年度季节性组件展示了全年床位利用率的波动。年末观察到的急剧下降可以归因于圣诞节假期期间。年度季节性组件的平滑循环结构反映了对此组件的傅里叶级数表示。
综合来看,这些组件与时间序列中识别的描述性模式一致。这些组件提供了对影响医院床位利用率因素的全面理解。趋势组件捕捉了长期变化以及像COVID-19大流行这样的重大事件的影响。假期组件量化了特定事件的影响,而周度和年度季节性组件突出了与医院运营和患者行为相关的重复模式。这种详细的理解可以为战略规划和资源分配提供信息,确保医院运营和患者护理的高效性。
模型组件分析:将训练数据拟合到Prophet模型的各个组成部分后,可以提供关于驱动医院床位利用率的潜在模式的宝贵见解。如图4所示,模型揭示了不同的趋势、假期效应、周度季节性和年度季节性。趋势组件反映了原始数据中的长期增长,包括COVID-19大流行期间的急剧下降以及随后的恢复。假期组件捕捉了特定事件对床位利用率的影响。正如预期的那样,公共假期导致利用率明显下降,证实了这些时期活动减少的观察结果。在大流行期间观察到了最显著的负面影响。这突显了大流行造成的重大干扰,其影响比普通的公共假期更为明显。周度季节性组件再现了工作日和周末之间明显的周期性循环,捕捉到了工作日较高的利用率和周末较低的利用率。年度季节性组件展示了全年床位利用率的波动。年末观察到的急剧下降可以归因于圣诞节假期期间。年度季节性组件的平滑循环结构反映了用于建模此组件的傅里叶级数表示。
为了评估中期医院床位利用率预测的准确性和可靠性,我们使用滚动交叉验证在多个预测范围内评估了Prophet模型。分析集中在四个规划间隔上:30天、60天、90天和180天,这些间隔的选择反映了医院管理中常见的运营和战术决策需求。相应的预测性能总结在表1中。模型的准确率在各个范围内都保持较高。均方根误差(RMSE)估计值范围从53.46(95%置信区间:49.28–57.83)到57.24(95%置信区间:55.44–59.04)。平均绝对误差(MAE),它以与数据相同的单位表示偏差的平均幅度,范围从38.77(95%置信区间:36.17–41.51)到43.07(95%置信区间:41.81–44.35),而评估期间(2022–2024年)的平均每日占用床位数为1,230张。平均绝对百分比误差(MAPE)在3.21%(95%置信区间:2.98–3.46)到3.53%(95%置信区间:3.42–3.64)之间变化,而中位数绝对百分比误差(MDAPE)略低,范围从2.37%(95%置信区间:2.12–2.64)到2.71%(95%置信区间:2.58–2.84)。对称MAPE(SMAPE)产生了相似的结果,范围从3.20%(95%置信区间:2.97–3.43)到3.54%(95%置信区间:3.43–3.65)。最后,覆盖率,反映了实际值落在预测区间内的比例,始终保持在80%以上,范围从80.37%(95%置信区间:79.04–81.70)到84.30%(95%置信区间:81.53–86.94)。
虽然我们的自助重采样程序为总体性能指标提供了不确定性估计,但它并没有揭示预测准确性如何随着预测范围的不同点而演变。为了补充总体评估,我们在图5中展示了特定于预测范围的变异性,该图详细可视化了来自60天预测范围的平均绝对百分比误差(MAPE)。散点图按预测范围(未来的天数)对每个单独的预测进行了排序,以便右侧的点对应于更远未来的预测。这种排序允许直观地检查随着预测范围的增加误差的行为。为了参考,图中标出了公共假期和正常工作日。散点图上叠加了MAPE的滚动平均值,这平滑了单个值的变异性,并揭示了预测准确性的总体趋势。虽然滚动平均值突显了模型的一致性能,MAPE值保持在5%以下,但仔细检查会发现误差幅度的波动。这些波动并没有显示出与假期的系统对应关系,表明模型适当地捕捉到了假期效应。然而,误差波动似乎每30天出现一次周期性。这种周期性可能表明了傅里叶级数对年度季节性的近似存在局限性,这可能会引入周期性的误差模式。
图6展示了60天床位利用率的预测与最后一次交叉验证折叠的观察值,提供了模型预测准确性的视觉评估。值得注意的是,模型紧密跟踪了床位利用率的观察到的波动,捕捉到了每日和每周的模式。此外,模型准确预测了圣诞节假期期间的床位利用率下降,这一点通过垂直虚线突出显示。
平均绝对百分比误差(MAPE)在滚动交叉验证期间的表现。该图表展示了一个散点图,其中包含了通过交叉验证过程得出的60天预测期的各个绝对百分比误差(MAPE)值,并叠加了滚动平均值(MAPE),以显示预测期内预测准确性的整体趋势。图6的替代文本可能是使用AI生成的。全尺寸图片。
该图表将实际观测到的医院床位占用率与60天的预测占用率进行了对比,直观地展示了模型跟踪实际波动的能力,包括周模式以及圣诞节假期期间的下降趋势,这些波动通过垂直虚线进行了突出显示。该模型基于2010年1月至2023年11月的数据进行了训练。
表1展示了Prophet在不同预测期内的自助性能指标。表格报告了估计的性能统计数据及其相应的95%置信区间(CI)。结果反映了在所有预测期内误差幅度的一致较低和不确定性估计的稳定性,表明了模型的预测能力较为稳健。全尺寸表格。
为了便于操作使用和理解预测结果,我们实现了一个交互式仪表板,可视化了历史和预测的床位占用情况(图7)。第一个面板展示了一个时间序列图,将实际观测到的占用率与Prophet生成的预测结果进行比较,使利益相关者能够直观评估模型的准确性和预期的趋势。第二个面板显示了每日入院和出院数量,提供了关于占用动态的上下文信息。这些可视化内容被整合到分析工作流程中,支持实时监控和回顾性验证,旨在帮助医院管理者进行短期至中期的容量规划。
图7的替代文本可能是使用AI生成的。全尺寸图片。
该图表展示了2025年3月至6月期间弗莱堡大学医疗中心的床位占用率和住院流动的集成视情况表。(顶部)预测的每日床位占用率(红线)及其预测区间(阴影区域)和实际观测值(点)。(底部)每日入院和出院数量,展示了运营波动和季节性变化。
本研究证明了Prophet模型在预测医院床位占用率方面的有效性。通过考虑公共假期和COVID-19大流行,模型能够捕捉到床位占用的复杂动态。成分分析揭示了与医院管理领域的知识和运营现实紧密吻合的可解释模式。趋势成分反映了医院服务在COVID-19大流行之前的扩张,随后出现显著下降并逐渐恢复,这与该时期医院运营的中断情况相符。每周的季节性变化显示工作日的占用率较高,周末则较低,这与选择性手术的安排和出院实践一致。模型还成功分离了公共假期和特殊事件的影响,例如圣诞节期间入院人数的急剧下降以及由疫情相关限制造成的多重中断。
在不同预测期内的性能评估保持稳健,平均绝对百分比误差(MAPE)始终低于4%。MAPE和SMAPE等指标之间的低分散度以及狭窄的置信区间表明,预测误差不仅平均来说较小,而且在不同预测期内也相对稳定。同样,平均绝对百分比误差与中位数绝对百分比误差之间的相对较小差距也表明了模型对异常值的抵抗力,突显了模型在不同占用场景下的适应性。此外,80%到84%的覆盖范围以及重叠的置信区间进一步强调了预测区间的可靠性。从操作角度来看,这意味着大约五分之四的未来占用率值落在模型的不确定性范围内,这对于中期规划是一个实用的基准。虽然这并不代表完美的校准,但这一覆盖水平为决策者提供了在现实不确定性下支持资源分配、人员配置和应急规划的可靠范围。
多项研究表明,相对简单的时序预测模型可以提供可靠的住院床位占用率预测。例如,Earnest等人[39]应用了一个季节性ARIMA(1,0,3)模型来预测2003年新加坡SARS疫情期间的隔离床位使用情况,实现了3天预测的MAPE为8.6%。在国家层面上,Shah等人[9]评估了指数平滑、SARIMA和TBATS在121个NHS信托机构中的表现,报告的中位数百分比误差从夏季的2.45%到冬季的4.91%不等,所有这些研究都没有使用神经网络。Vollmer等人[26]也发现,惩罚线性模型在多个医院站点的短期至中期预测中表现优于一系列机器学习和深度学习方法。与这些发现一致,我们基于Prophet的方法在30天和60天的预测期内的MAPE分别为3.21%和3.23%,显著优于Kutafina等人[10]报告的5.55%和5.48%。
尽管关于Prophet在医疗保健和医院管理领域预测性能的文献结果不一,但这些不一致性主要反映了这些领域内预测任务和预测期的多样性。预测准确性高度依赖于特定目标变量、时间分辨率和预测期;无论是急诊科(ED)到达人数[33, 40, 41]、出院人数[34, 42]还是住院床位占用率[37, 40]。然而,文献中的证据支持了这样一个观点:即使在高度波动的情况下,模型的简单性往往也足够使用。例如,Tuominen等人[30]发现LightGBM在每小时急诊科人数预测方面的表现优于深度学习方法,而Caldas等人[31]报告称,与简单模型相比,Temporal Fusion Transformer仅带来微小的改进。这些发现表明,能够容易捕捉季节性和假期效应的加法或基于树的方法可以在保持易于解释、自动化和维护的同时,与更复杂的方法相匹配或超越它们。
在中期医院床位占用率预测的背景下,本研究的结果证明了Prophet模型的有效性,这体现在其显著的低MAPE值上。这些发现引发了这样一个问题:对于这项特定任务和时间范围来说,是否真的需要更复杂的预测架构。与急诊科到达人数这样的高度波动目标不同,床位占用率受到物理容量的限制,这本质上限制了其可变性[43]。在稳定的运营条件下,它还受到如周周期和季节性趋势等可预测模式的影响[44]。像Prophet这样的基于可分解时序分析的模型正是为了捕捉这些结构化成分而设计的[35]。尽管Tuominen等人[40]认为由于住院天数(LoS)的变异性,床位占用率比到达人数更难预测,但他们的发现主要适用于非常短期的预测(例如,提前一天的预测),在这种情况下,个别患者流动的随机性起着更大的作用。对于中期预测,当这些波动趋于平稳时,Prophet建模总体趋势和季节性的能力变得更加有利。
研究一致地表明,增加模型复杂性往往会导致回报递减,预测准确性的提升幅度很小,同时计算成本和维护负担显著增加。这种模式在各个领域中都很常见,其中边际的准确性提升很少能证明大幅增加计算资源和维护需求的必要性[45, 46]。Prophet在这方面提供了几个实际优势,最显著的是它对超参数调整的需求最小。减少对复杂优化的依赖在操作上是有利的,因为它降低了与反复微调相关的计算成本和维护负担,同时使得在机器学习专业知识有限的环境中能够快速部署预测结果。通过最小化对复杂优化的需求,可以将精力集中在将预测结果整合到临床决策中。
虽然Prophet展示出了有希望的结果,但我们的研究也存在一些局限性。模型的准确性可能会受到历史数据的可用性和质量的影响。此外,它假设过去的模式会持续到未来,但在面对突然的系统性变化时,这一假设可能不成立。尽管平均和中位数绝对百分比误差值接近5%,但偶尔出现的异常值可能会限制模型在医院运营中的实际用途。异常值的周期性可能反映了傅里叶级数表示年度季节性的局限性。这些波动需要进一步研究,并可以在未来的工作中加以解决。此外,COVID-19大流行的表示被简化为一个二元指标,仅捕捉了其整体破坏性影响,而没有涵盖其多阶段的动态或流行病学驱动因素,如感染率和住院率。虽然这种抽象对于当前分析来说已经足够,但更丰富的流行病学数据可以帮助在未来研究中区分大流行特有的效应。
除了模型准确性之外,这项工作还展示了将预测模型整合到生产就绪的端到端系统架构中的方法。云原生的模块化数据管道的实施支持生成可靠的高频医院床位占用率预测结果。预测结果通过分析仪表板呈现,为临床和行政人员提供了历史和预测占用率的交互式视图,从而弥合了预测输出与日常决策之间的差距。
准确预测医院床位占用率对于优化资源分配和确保高效的患者护理至关重要。本研究表明,Prophet提供了一个稳健、可解释且操作上可行的中期医院床位占用率预测解决方案。尽管有更复杂的预测方法可供选择,但我们的结果显示Prophet在预测准确性方面具有竞争力,同时提供了简单性、透明性和易于集成到临床工作流程中的额外优势。该模型有效地捕捉了关键的时间动态,如季节性、假期效应和长期趋势,为容量规划和资源分配提供了有价值的见解。这些发现支持了一个更广泛的观点,即对于结构化且相对稳定的医疗保健预测任务,简单的模型不仅在准确性上可能胜过更复杂的模型,而且在可重复性、可扩展性和可用性方面也是如此。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号