FORTA评分的纵向非干预性变化与社区居住的老年人认知和身体功能测试的变化相关

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Drugs & Aging》：Longitudinal Non-interventional Changes of the FORTA Score are Associated with Changes of Cognitive and Physical Function Tests in Community-Dwelling Older People

【字体：大中小】 时间：2026年05月04日 来源：Drugs & Aging 3.8

编辑推荐：

　　摘要背景研究发现，药物清单工具能够改善老年人的药物治疗效果；FORTA（Fit-fOR-The-Aged）清单是一个经过临床验证的、用于评估药物适宜性的正面-负面清单。本研究回顾性分析了FORTA评分与老年人身体和认知功能关键指标之间的长期相关性。方法本

　　摘要
背景
研究发现，药物清单工具能够改善老年人的药物治疗效果；FORTA（Fit-fOR-The-Aged）清单是一个经过临床验证的、用于评估药物适宜性的正面-负面清单。本研究回顾性分析了FORTA评分与老年人身体和认知功能关键指标之间的长期相关性。

方法
本研究分析了504名参与多中心队列研究（AgeCoDe/AgeQualiDe）的参与者，这些参与者在三个随访时间点（FU 6–8；平均年龄范围87.9–89.7岁）接受了FORTA评分（过度治疗和治疗不足错误的总和）的评估；其中292–328名患者的三个随访时间点数据间隔为10个月，可供比较。

结果
单变量分析显示，FORTA_Delta_76（FU 6和FU 7之间FORTA评分的变化）与ADL（日常生活活动）_Delta_76（负相关，p < 0.01）以及FORTA_Delta_76与MMSE（简易精神状态检查）_Delta_76（负相关，p < 0.01）之间存在显著相关性。多变量分析（使用前向选择模型，p < 0.05）也显示FORTA_Delta_76与MMSE_Delta_76之间存在显著相关性（p < 0.05）。其他比较的单变量分析仅对FORTA_Delta_86和MMSE_Delta_86显著。

结论
研究表明，FORTA评分作为药物适宜性的综合指标，在无干预情况下的长期变化与ADL和MMSE的变化相关：评分越低，功能结果越好。这些发现与早期的干预数据一致，强调了FORTA在改善老年人临床结局方面的潜力。

关键词
本研究探讨了老年人药物治疗适宜性与关键老年健康结果之间的长期关联。FORTA评分所测量的药物治疗适宜性的长期非干预性变化与相关临床结果存在显著关联。

1. 引言
老年人由于多病共存，经常需要使用五种或更多药物（[1,2,3,4,5,6]），这可能导致功能独立性的丧失、身体表现下降、认知能力衰退、住院甚至死亡（[2, 6,7,8,9,10,11]）。为了解决这一问题，已经开发了各种药物清单和/或行动指南，例如Beers标准?。然而，只有少数清单基于患者的特征（如诊断、病情严重程度、功能状况和患者需求）[4, 6]。这些清单可能更有助于临床医生处理多重用药问题，并解决治疗不足和治疗过度的问题（[6]）。大多数清单（如Beers标准? [12]）列出了老年人应避免使用的药物。相比之下，START/STOPP筛查工具（[13]）或Fit fOR The Aged（FORTA）清单[14]包括了药物治疗的正面和负面建议。这些工具基于对患者疾病、病情严重程度以及身体和认知能力的全面了解，不能仅通过查看患者的药物清单来使用[4, 6]。只有那些正面-负面清单展示了有益的临床效果。有人提出“以患者为中心的清单方法”（PILA）优于“以药物为中心的清单方法”（DOLA）[4, 6]，以强调其整体优势。例如，在一项针对老年住院患者的随机对照试验（VALFORTA）中，FORTA显著提高了药物质量（通过FORTA评分衡量）。此外，重要的临床结果（如药物不良反应和日常生活活动（ADL）也得到了改善[6, 15]。

2. 方法
2.1 研究设计和研究人群
本研究基于2003/2004年开始的“老龄化、认知与痴呆症研究”（AgeCoDe），这是一项多中心（波恩、杜塞尔多夫、汉堡、莱比锡、曼海姆和慕尼黑）的基于人群的纵向队列研究，对象是初级保健患者。招募标准为基线时年龄在75岁及以上且未诊断为痴呆症的患者。随访（FU）评估平均间隔为1.5年（[6, 18]），直到FU 7；从FU 7开始间隔缩短为10个月。第8次随访于2016年完成（[6, 19]）。

2.2 数据收集
在FU 7之后的数据来自AgeQualiDe研究（一项关于高龄初级保健患者需求、医疗服务使用、成本和健康相关生活质量的研究[85+]）。AgeQualiDe扩展了AgeCoDe的研究，继续采用类似的数据收集程序、诊断标准和核心结果评估方法，以实现跨研究阶段的纵向分析。不过，引入了一些修改，包括上述的较短随访间隔以及额外的评估指标（如生活质量和医疗利用情况）。

2.3 FORTA（Fit fOR The Aged）诊断
并非所有FORTA诊断的数据都可用。非FORTA诊断的对应关系已在先前的研究中详细说明[16]；简而言之，以下诊断可视为FORTA诊断“胃肠道疾病”：胃炎、反流性胃炎、反流、食管癌和胃肠道出血。同样，中风、脑梗死、脑动脉狭窄和短暂性脑缺血发作也被归类为FORTA诊断“中风”[6]。这些研究的更多细节在其他文献中提供[18, 19, 22,23,24,25,26,27,28,29,30]以及关于FORTA分析的早期论文中[6, 15]。

2.4 伦理批准
AgeCoDe和AgeQualiDe研究已获得所有参与中心的伦理委员会批准[23]，这些研究符合世界医学协会的伦理准则[6, 31]。此外，之前获得的伦理批准（参考编号：2007-253E-MA）以及海德堡大学曼海姆分校伦理委员会最近更新的批准（参考编号：TEMP558252-AF 11）涵盖了本文的研究内容[6]。

2.5 FORTA评分的确定
FORTA清单将药物分为四个类别：
- **A类（绝对必要）**：在老年人中已证明具有明确疗效/安全比的必需药物
- **B类（有益）**：在老年人中具有明确疗效但效果有限或存在安全问题的药物
- **C类（谨慎）**：在老年人中疗效/安全性存疑的药物，应避免使用或在药物过多、无益处或出现副作用时考虑替代方案
- **D类（不建议）**：在老年人中应避免使用，首先应考虑替代方案

FORTA评分是个体患者中过度治疗和/或治疗不足错误的总和。如果患者未接受适当的治疗（尽管存在有益的药物选项），或者处方不符合FORTA分类（例如，存在A类或B类药物但使用了C类药物），或者药物使用不当（例如，FORTA分类为C类但实际使用了A类或B类药物），则视为错误。

2.6 统计分析
2.6.1 样本量分析
先前的样本量分析[16]表明，该队列中310名患者足以检测到最小的临床重要差异（MCID，一个评分点），假设标准差为2.7（功效=0.9）。FORTA评分变化的MCID基于VALFORTA试验中的差异（1.7），该试验显示了临床益处；虽然无法从这些数据中建立明确的剂量-反应关系，但假设MCID为1是合理的，符合临床成功标准。

2.6.2 相关性分析
使用Spearman相关性分析，将FORTA评分的变化（delta FORTA）与ADL、IADL（工具性日常生活活动）、MMSE的变化进行了分析，所有变量均视为连续变量。为了减少I型错误的风险，应用了Bonferroni校正方法。FORTA评分的变化（delta FORTA）作为连续变量进行分析，以捕捉变化的全部范围和幅度，并避免二分法导致的信息损失。同时，使用多变量线性回归模型评估FORTA评分变化与临床结果（MMSE、ADL和IADL）之间的关联，调整了年龄、性别、药物数量和共病数量等潜在混杂因素。临床相关的下降定义为MMSE和IADL下降≥1分，ADL下降≥5分。通过接收者操作特征（ROC）曲线分析评估连续FORTA评分变化区分具有临床相关下降和没有临床相关下降的参与者的能力，曲线下面积（AUC）作为区分性能的指标。最佳分界值是使用Youden指数估算的，仅出于探索性目的而报告，因为观察到的区分能力有限。为了便于与先前的方法进行比较，还进行了额外的敏感性分析，在该分析中，根据FORTA评分变化的方向（delta FORTA > 0 vs < 0）对参与者进行了分类。组间差异使用Wilcoxon秩和检验进行评估；然而，这种二分法由于其固有的局限性而被认为是次要的。相关性的强度根据[33]进行分类；此处报告的所有相关性均为“弱”（例如，< ± 0.3）。统计显著性假设为p < 0.05。统计分析使用SAS版本9.4软件（SAS Institute Inc.，北卡罗来纳州卡里）和R版本4.5.1（R Foundation for Statistical Computing，奥地利维也纳）进行。此外，使用了STROBE检查表（电子补充材料1 [ESM 1] [34]）来确保包含相关数据。

3 结果
表1显示了FU 6-8中包含的患者的人口统计学特征、临床特征和数量。表1 显示了FU 6（总数=504）、FU 7（总数=430）和FU 8（总数=433）的队列的人口统计学特征和临床特征。
3.1 FU6-FU7
共有316名患者的数据在FU 6和FU 7中都完整可用。对FORTA_Delta_76（FU 6和FU 7之间的FORTA评分变化，所有缩写均适用）与ADL_Delta_76（-0.155*，p < 0.01）以及FORTA_Delta_76与MMSE_Delta_76（-0.203*，p < 0.01）之间的单变量分析显示了显著的相关性。然而，FORTA_Delta_76与IADL_Delta_76之间的相关性并不显著（-0.068*，p > 0.05）。
即使在使用Bonferroni校正的更严格分析中（即，将显著性水平降低到α/3 = 0.0166后），也观察到了显著性。FORTA_Delta_76与IADL_Delta_76之间的相关性仍然不显著（-0.067*，p > 0.05）。此外，我们比较了Delta FORTA评分为0或更高的患者与Delta FORTA评分为-1或更低的患者在身体功能测试（ADL_Delta_76和IADL_Delta_76）和认知测试（MMSE_Delta_76）结果上的变化（图1）。
图1
此图像的替代文本可能是使用AI生成的。
全尺寸图像
对于FU 6和FU 7之间FORTA评分变化为0的分界值，ADL（A）和MMSE（C）在FORTA评分较低的患者中显著更高；IADL（B）的差异不显著（Wilcoxon秩和检验）。ADL（日常生活活动）、FORTA Fit fOR The Aged、FU随访、IADL（工具性日常生活活动）、MMSE（简易精神状态检查）
ROC分析表明FORTA评分变化对于临床相关的下降具有有限的区分能力（AUC 0.54–0.62）。这些发现表明，FORTA评分变化并不作为一个基于阈值的预测因子，而是反映了与功能和认知结果的连续和渐进的关联。相应的ROC曲线显示在ESM中。
使用前向选择线性回归模型的多变量分析显示，调整了以下混杂因素后，FORTA_Delta_76与MMSE_Delta_76之间存在显著关联（β = -0.123，SE = 0.061，t = -2.02，p = 0.045）：性别、年龄、药物数量（FU 6和7）和疾病数量（FU 6和7）。在多变量分析中，未发现ADL_Delta_76（β = -0.287，SE = 0.329，t = -0.87，p = 0.38）和IADL_Delta_76（β = -0.048，SE = 0.033，t = -1.47，p = 0.14）的显著关联。
3.2 FU7–FU8
在FU 8与FU 7的分析中，基于数据的可用性，共包括了328名患者。除了平均FORTA评分外，其他平均评分（ADL、IADL、MMSE）在FU 8检查中均有所下降。FORTA_Delta_87与相应的ADL、IADL或MMSE的delta之间没有发现统计学上的显著相关性（p > 0.05；相关系数分别为-0.068、-0.012和-0.113）。此外，我们比较了Delta FORTA评分为0或更高的患者与Delta FORTA评分为-1或更低的患者在身体功能测试（ADL_Delta_87和IADL_Delta_87）和认知测试（MMSE_Delta_87）结果上的变化（ESM中的补充图1）。
在检查混杂因素的影响时，我们发现FORTA_Delta_87与FU 8时的药物数量之间存在显著的正相关（0.115，p < 0.05）。对于ADL_Delta_87，我们观察到与FU 8和7时的药物数量存在显著的负相关（分别为-0.151，p < 0.01和-0.136，p < 0.05），以及与FU 8时的疾病数量也存在负相关（-0.116，p < 0.05）。关于IADL_Delta_87，与FU 8和7时的疾病数量存在显著的负相关（分别为-0.233，p < 0.001和-0.122，p < 0.05），以及与FU 8和7时的药物数量也存在负相关（分别为-0.203，p < 0.001和-0.187，p < 0.001）。然而，未检测到MMSE_Delta_87的显著相关性。
3.3 FU6–FU8
共有292名患者的数据在FU 6和FU 8中都完整可用。FORTA_Delta_86与ADL_Delta_86以及FORTA_Delta_86与IADL_Delta_86之间的单变量分析未显示显著相关性（p > 0.05；相关系数分别为-0.091和-0.026）。然而，FORTA_Delta_86与MMSE_Delta_86之间存在显著相关性（-0.136，p < 0.05）；然而，在应用Bonferroni校正后，这种显著性消失了。此外，我们比较了Delta FORTA评分为0或更高的患者与Delta FORTA评分为-1或更低的患者在身体功能测试（ADL_Delta_86和IADL_Delta_86）和认知测试（MMSE_Delta_86）结果上的变化（ESM中的补充图2）。
接下来，我们在分析中考虑了几个潜在的混杂因素。FORTA_Delta_86的分析没有显示出任何混杂因素的统计学显著结果（ESM中的补充表1）。然而，在检查ADL_Delta_86与混杂因素之间的关联时，我们发现与患者年龄、FU 8时的疾病数量以及FU 6和8时的药物数量存在显著的负相关（ESM中的补充表2）。对于IADL_Delta_86，仅与FU 8时的疾病数量存在显著的负相关（-0.116，p < 0.05）。MMS_Delta_86与年龄这一混杂因素存在显著的负相关（-0.192，p < 0.01）。
4 讨论
这项回顾性的、纵向的、非干预性研究表明，FORTA评分的变化与ADL和MMSE的变化相关：评分越低，功能结果越好。特别是，作为认知功能临床测试的MMSE即使在多变量分析中也与FORTA评分相关。这些发现与早期的干预数据一致；它们强调了FORTA驱动的药物优化在改善老年人临床终点方面的潜力。
迫切需要改善老年多病患者的药物治疗；一种流行的方法似乎是减少药物处方，从而去除“不良”药物（PIM，即可能不适当的药物）。不幸的是，这种方法令人失望，因为没有去除任何PIM，也没有改善临床终点[4, 35, 36, 37]，包括使用美国Beers标准和德国PRISCUS列表[38]。相比之下，同时解决过度治疗和治疗不足问题的方法几乎是唯一在临床上有效的[4, 15, 39]；然而，另外两项关于PILA START/STOPP的大型干预试验并未显示出有益的临床结果：OPERAM和SENATOR[40, 41]。即使在这些PILA试验中，也很少能够将建议付诸实践。
到目前为止，FORTA列表在对照的随机临床试验中取得了成功：FORTA干预显著改善了以下重要的临床终点：跌倒、Barthel指数（ADL）和不良反应，后者的治疗所需人数仅为5人[15, 42]。几项关联研究与这些干预研究一致，尽管并未证明因果关系；早期论文中的AgeCoDe数据显示，FORTA评分（见上文）与基线和所有FU访问时的ADL/IADL之间存在显著相关性。即使在多变量分析中，这种相关性对于ADL/IADL也是显著的。此外，FORTA评分较高的患者的平均FORTA评分显著高于没有痴呆症的患者。在FU 8时的死亡率在FORTA评分较高时显著增加[16]。一项来自VALFORTA试验的关联研究[15]显示，FORTA评分与IADL、Tinetti测试、Essen年龄和嗜睡问卷、MMSE以及在单变量分析中与手握力存在显著相关性，在多变量分析中也与IADL、Tinetti测试和Essen年龄和嗜睡问卷存在相关性[17]。然而，一项回顾性研究在12个月的随访期内未发现FORTA评分与MMSE等结果之间的显著关联[43]。Chen等人的另一项关联研究[44]显示，较高的FORTA评分与老年结直肠癌患者的总体生存率和结直肠癌特异性生存率较差显著相关。此外，在一项针对超过50,000名社区居住的老年人的基于人群的队列研究中，FORTA定义的不适当处方与老年疾病，特别是神经认知障碍、抑郁症、帕金森病和COPD有强烈关联[45]。
总的来说，这些关联研究主要是给定时间点/FU的横断面分析。这项研究表明，其中一些显著相关性可能在纵向研究中仍然存在，特别是对于ADL和MMSE，可能需要更长的时间才能出现更大的或显著的变化。在这项回顾性纵向研究中，只有FORTA评分随时间的变化与相应的临床终点变化相关。大多数显著性出现在FU访问6到7之间的较长时间间隔（18个月）；这些显著性在FU访问7到8之间消失了，但这个间隔明显较短（10个月）。这可能推测性地表明临床效应可能是由FORTA评分的变化驱动的；这些效应可能需要超过10个月才能发展。然而，这些差异也可能由于样本大小的变化、回归到平均值、更长时间的随访中的变异性增加、变化评分的敏感性降低、更多虚弱参与者的选择性退出或功效损失所致。
需要注意的是，Bonferroni的多次检验校正预期会减少显著性的数量，表明一些差异仅由于混杂因素而显著。
尽管仍然是非干预性的，这种类型的分析可以检测到临床效应与FORTA评分变化的关联，而不是FORTA评分的一次性状态。这意味着无论是什么导致了药物使用的适当性的改善或恶化（通过FORTA评分衡量），都与临床变化相关。这些发现表明，根据事后分配的FORTA错误尝试改进药物可能与改善的结果相关，即使在干预试验中不是系统地实施的。相比之下，药物使用的适当性恶化（FORTA评分的增加）与患者的伤害相关，即使在这种非干预性试验中也是如此。无论如何，这种假设生成的关联需要在前瞻性对照临床试验中得到证实。
尽管ROC分析的区分能力有限，FORTA评分的变化似乎反映了与功能和认知结果的渐进的、连续的关联，而不是一个明确的阈值效应。
4.1 限制
分析依赖于之前从已完成研究中收集的数据；因此，对于FORTA评估至关重要的患者数据和诊断信息部分缺失[6]。有必要将一些FORTA诊断分配给可用的类似诊断[6]。诊断的对齐可能存在偏差，从而影响结果[6]。因此，这种验证仅限于可用的诊断，因此可能不适用于所有FORTA诊断都进行了前瞻性评估的患者[6]。同样，由于FU已经完成，药物评估可能受到不完整数据的影响，这些数据无法补充[6]。
纳入更大队列的病例在很大程度上取决于进行这项次要分析所需数据的可用性。数据的可用性可能引入了进一步的偏差[6]。
FU访问之间的时间间隔不同；这可能对临床效应的大小有影响。此外，来自同一参与者的重复测量被视为独立观察。这种方法没有考虑受试者内部的相关性，这可能会影响方差估计的结果，尽管已经应用了Bonferroni校正方法。这些局限性也可能解释了在比较FU 6/7、7/8和6/8组时结果出现的异质性，尤其是由于FU 7/8的时间间隔较短，导致后两组中显著差异的数量较少；另一方面，对于FU 6/7组，即使采用了更严格的Bonferroni校正分析，仍然显示出了相关的显著性。另一个局限性是，我们的多变量分析仅调整了性别、年龄、用药数量和疾病数量等因素，而没有纳入诸如身体虚弱程度、疾病严重性和急性医疗事件等重要因素，这些因素可能会影响观察到的关联结果。未来的研究，最好是包含这些混杂因素的前瞻性研究，将有助于更准确地评估FORTA评分与出院后结局之间的关系。最后，本研究的结果仅限于药物治疗质量与相关临床结果之间的相关性。由于本研究属于非干预性研究，这些关联结果并不具有因果关系，相关的假设需要在干预性、随机化、对照试验中得到验证。

**结论**
这些发现表明，根据事后分配的FORTA错误来调整药物使用的适宜性（通过FORTA评分衡量），即使这些调整没有在干预性试验中系统地实施，也可能对患者产生临床影响；在这里，这些变化反映了常规护理所带来的、与试验无关的调整。无论是与更好的临床表现相关的药物使用适宜性的改善，还是与更差的临床结果相关的药物使用适宜性的恶化，都是如此。

联系信箱：

粤ICP备09063491号

热点排行