评估在线健康预约系统实施结果的心理测量学特性：一项在加纳大学医院开展的实证研究

《Implementation Science Communications》：Psychometric evaluation of acceptability, appropriateness, and feasibility measures for a students’ online health appointment system in a university hospital in Ghana

【字体：大中小】 时间：2026年03月13日 来源：Implementation Science Communications 3.3

编辑推荐：

　　为解决在数字健康实施评估中，特别是在撒哈拉以南非洲地区，关于实施结果（如可接受性、适当性、可行性）的测量工具缺乏心理测量学证据的问题，研究人员对加纳一所公立大学的学生在线健康预约系统（SOHAS）的15项量表进行心理测量学评估。结果表明，该量表展现出高内部一致性、良好的模型拟合和较强的收敛效度，为评估类似环境下的数字健康实施提供了有价值的框架，但适当性与可接受性之间的区分效度尚需改进。

在追求全民健康覆盖的道路上，实施科学（Implementation Science）扮演着创新引擎的角色，旨在将有效的卫生干预措施更快、更高效地转化为现实世界的实践。然而，理想与现实之间，常常横亘着一道“知易行难”的鸿沟。尤其在资源有限、挑战多元的中低收入国家，如何衡量一项新干预措施是否“好用”、“管用”并且“能用”，本身就成为一个科学难题。数字健康技术，比如在线预约系统，被视为优化资源配置、提升服务可及性的利器，但当我们将目光投向撒哈拉以南非洲的大学校园时，会发现一个令人尴尬的现状：尽管相关系统可能已经部署，但评估其“实施结果”——即系统在现实中被使用者接受、感知为合适并认为可行的程度——往往缺乏可靠、有效的“尺子”。具体而言，测量“可接受性（Acceptability）”、“适当性（Appropriateness）”和“可行性（Feasibility）”这些关键实施结果的标准工具，其概念清晰度、有效性和可靠性，在该地区语境下仍缺乏实证证据。没有一把好用的“尺子”，我们就难以准确诊断系统实施中的痛点，更谈不上有的放矢地改进。为了解决这一“度量衡”的困境，一项研究聚焦于加纳库马西的夸梅·恩克鲁玛科技大学，对这所公立大学中的学生在线健康预约系统（Students’ Online Health Appointment System, SOHAS）的评估工具，进行了一次全面的“体检”——心理测量学评估。这项研究不仅关乎一把“尺子”的校准，更关乎为评估数字健康在类似环境中的实施效果，提供一个科学、可靠的评估框架。相关成果发表在《Implementation Science Communications》期刊上。

为了评估这把“尺子”的精准度，研究团队开展了一项横断面研究。他们采用了经过文化、语言和语境适应性调整的15项实施结果测量量表，针对SOHAS系统进行测评。研究参与者通过包含电子问卷链接的短信在线招募。在数据分析阶段，研究人员运用了探索性因子分析（EFA）和验证性因子分析（CFA）来分别探查潜在的因子结构并检验模型拟合优度。内部一致性通过克朗巴哈系数（Cronbach's alpha）和项目-总分相关性来衡量。而对于效度的检验则更为深入：收敛效度（convergent validity）和区分效度（discriminant validity）通过组合信度（Composite Reliability, CR）、平均方差抽取量（Average Variance Extracted, AVE）、Fornell-Larcker准则以及异质-同质（Heterotrait-Monotrait, HTMT）比率等方法进行了系统考察。

结果

内部一致性

测量显示出了极高的内部一致性可靠性。三个构念（可接受性、适当性、可行性）的克朗巴哈α系数范围在0.946至0.977之间，组合信度（CR）的范围在0.949至0.976之间，均远高于0.7的推荐阈值，表明量表条目之间具有高度的一致性。

因子结构与模型拟合

探索性因子分析揭示了一个清晰的三因子结构，与理论预设相符，各条目在对应因子上的载荷值很高（范围在0.716至0.969之间），且公因子方差（communalities）显著。随后的验证性因子分析进一步证实了该三因子模型具有良好的整体拟合优度。具体拟合指标为：比较拟合指数（CFI）为0.969，塔克-刘易斯指数（TLI）为0.962，均大于0.95的优秀标准；标准化残差均方根（SRMR）为0.022，远小于0.08的标准。虽然近似误差均方根（RMSEA）为0.092，略高于0.08的严格标准，但在样本量较大的情况下仍可被接受。这些指标共同支持了量表结构的稳定性。

收敛效度

收敛效度的检验结果非常积极。三个构念的平均方差抽取量（AVE）值介于0.790到0.892之间，全部高于0.5的临界值，且对应的组合信度（CR）值也很高，这为量表具有强收敛效度提供了坚实的证据，意味着测量同一构念的不同条目确实汇聚于该构念。

区分效度

然而，在区分效度方面，研究遇到了挑战。分析发现，适当性（Appropriateness）与可接受性（Acceptability）这两个构念之间的异质-同质（HTMT）比率超过了可接受的限度。同时，构念间的相关系数也超过了对应平均方差抽取量（AVE）平方根（√AVE）的值。这两项结果均表明，在本研究中，可接受性与适当性两个构念未能被有效地区分开来，它们之间存在显著的概念与统计重叠。

结论与讨论

本研究对加纳大学环境中用于评估学生在线健康预约系统（SOHAS）的可接受性、适当性和可行性的量表进行了心理测量学评估。结果显示，经过调适的量表展现出了令人信服的心理测量学特性，包括极高的内部一致性、良好的模型拟合度以及强有力的收敛效度。这证实了该量表在测量相关构念时是可靠且有效的，能够为评估类似资源有限环境下的数字健康干预实施情况提供一个有价值的标准化评估框架。

然而，研究也揭示了一个关键的限制：可接受性与适当性两个构念之间缺乏充分的区分效度。这表明，在当前的操作化定义和测量条目下，参与者可能难以清晰区分“对系统感到满意或认可”（可接受性）与“感知系统与情境的匹配度或相关性”（适当性）。这种概念的混淆对精准评估和实施策略的针对性提出了挑战。

因此，该研究的核心意义在于双重的：一方面，它验证了一套可用于加纳乃至类似中低收入国家背景下，评估数字健康工具实施结果的有效测量工具，填补了实证证据的空白。另一方面，它明确指出了未来研究需要努力的方向——必须从概念层面和实证测量层面进一步提炼和厘清“可接受性”与“适当性”的边界，通过理论发展和条目优化来提升其区分效度。唯有如此，实施科学的研究者和实践者才能更精准地“诊断”实施过程中的不同维度的问题，从而设计出更有效的“处方”来促进创新健康技术的成功落地与推广。这项研究不仅提供了一把经过校准的“尺子”，也清晰地标明了尺子上有待进一步精确刻度的区间，推动着该领域测量科学向更严谨、更实用的方向迈进。

热点排行

新闻专题