纤维肌痛临床试验中的缺失数据处理——纵向分析中应用线性混合模型的考量:风湿病学视角

《Clinical Rheumatology》:Handling missing data in fibromyalgia clinical trials—considerations for the use of linear mixed models in longitudinal analyses: perspectives in rheumatology

【字体: 时间:2026年06月07日 来源:Clinical Rheumatology 2.8

编辑推荐:

  摘要目的 批判性审视纤维肌痛随机对照试验(RCTs)中处理缺失数据的当前统计实践,并为线性混合模型(Linear Mixed Models, LMMs)的实施提供实用指导。 方法 该方法学与叙述性观点文章回顾了近年来纤维肌痛领域的RCTs,强调缺失数据处

  
摘要目的

批判性审视纤维肌痛随机对照试验(RCTs)中处理缺失数据的当前统计实践,并为线性混合模型(Linear Mixed Models, LMMs)的实施提供实用指导。

方法

该方法学与叙述性观点文章回顾了近年来纤维肌痛领域的RCTs,强调缺失数据处理及纵向分析中常见的局限性。文章在意向性分析(Intention-to-Treat, ITT)框架下,对比了传统方法,如重复测量方差分析(ANOVA),与基于LMM的分析策略。此外,文章还提供了在SPSS中实施LMMs的分步指南。

结果

证据表明,许多纤维肌痛RCTs仍持续依赖次优统计方法,包括排除数据不完整的受试者以及采用基于ANOVA的方法。这些做法可能降低与ITT原则的一致性,降低统计效率,并导致治疗效应估计出现潜在偏倚。相比之下,LMMs能够纳入部分观测到的纵向数据,显式建模受试者内相关性,并在随机缺失(Missing At Random, MAR)假设下处理不平衡纵向设计。然而,其有效性取决于模型设定的正确性以及潜在假设的可信性。

结论

纤维肌痛RCTs中方法学建议与实际分析实践之间持续存在的差距,可能损害治疗效应估计的可解释性与可靠性。对于涉及随访不完整数据的纵向分析,LMMs可能代表一种更具灵活性且方法学上更为恰当的分析路径,尤其是在其与研究设计特征及现有统计专业能力相匹配时。提升该领域统计学严谨性仍然至关重要,从而支持更可靠的临床解释与循证决策。
本文发表于《Clinical Rheumatology》,是一篇围绕纤维肌痛(fibromyalgia)随机对照试验(Randomized Controlled Trials, RCTs)中缺失数据处理问题展开的方法学视角文章,核心关注纵向随访资料分析中线性混合模型(Linear Mixed Models, LMMs)的应用价值。研究背景在于,纤维肌痛临床研究常存在较高失访率、退出率及重复测量数据不完整等问题,而这类问题会直接影响治疗效应估计的稳定性、解释性与可信度。纤维肌痛作为一种慢性、症状波动显著的风湿相关疾病,患者常因疼痛加重、疲劳、心理社会因素或疗效不佳而中断干预或失访,因此纵向研究中缺失数据并非偶发技术细节,而是会实质性影响试验结论的关键方法学挑战。在此背景下,若仍采用仅适用于完整数据或对协方差结构要求较严格的传统统计策略,可能造成与意向性分析(Intention-to-Treat, ITT;即所有随机分组对象均应尽可能纳入分析)的原则不一致,并引入偏倚。

目前存在的主要问题包括:其一,纤维肌痛RCTs中缺失纵向数据高度常见;其二,相关研究对缺失数据处理的报告往往不足,或处理方式本身不够合理;其三,尽管长期以来方法学文献已推荐在纵向研究中使用LMMs,但其在纤维肌痛RCTs中的实际应用仍不一致;其四,面向风湿病学临床研究者的可操作性指导仍然有限。研究人员因此开展本研究,目的并非系统评价所有纤维肌痛RCTs,而是以叙述性、临床导向的方法学评论形式,结合近期代表性研究实例,分析当前统计实践中的持续性局限,并提出LMMs在该领域中的实践建议。文章强调,这一议题并不局限于纤维肌痛,但纤维肌痛因症状波动性大、治疗反应异质性高、失访风险高,使得缺失机制更加复杂,随机缺失(Missing At Random, MAR)假设也更值得谨慎审视,因此更能凸显分析方法选择的重要性。

研究人员首先通过若干近期纤维肌痛RCTs实例说明,临床试验中仍普遍存在排除中途退出受试者、采用修正ITT、依赖干预前后比较或重复测量方差分析等情形。这些做法未必在所有情况下都错误,但在存在不完整随访和重复测量相关性的条件下,可能降低估计效率、削弱统计功效,并使治疗效应估计更容易受失访模式影响。文章列举了温针灸、居家经颅直流电刺激、干针等干预研究,指出这些研究虽然具有重要临床意义,但在统计分析中未充分利用LMMs处理部分观测纵向数据的优势。基于这些实例,研究人员得出的主要结论是:纤维肌痛RCTs中方法学建议与实际统计实践之间仍存在明显鸿沟,而这一鸿沟可能损害治疗效应估计的可靠性及临床解释的稳健性。

从方法学原理上,文章系统阐释了LMMs相较传统重复测量方差分析的优势。LMMs能够通过随机效应(random effects)处理同一受试者内重复观测之间的相关性,允许使用更灵活的协方差结构,不要求严格满足球形假设,并且可在MAR假设下利用极大似然估计(maximum likelihood estimation)纳入部分缺失的纵向数据,而不必因个别时间点缺失而整例删除。对于遵循ITT原则的RCTs而言,这种特征尤其重要,因为传统分析常要求各时间点完整数据,容易排除部分受试者,从而降低与ITT原则的一致性。文章同时强调,LMMs并不自动等同于“完整的”ITT分析;若随机化后结局数据完全缺失,LMMs也无法凭空恢复信息。因此,LMMs应被理解为在特定假设条件下更适合处理不完整纵向数据的方法,而不是能够天然“解决”缺失数据问题的万能工具。

作者为开展论述主要采用了叙述性方法学综述、近期纤维肌痛随机对照试验实例比较分析、统计方法对照分析以及软件实践流程展示等关键技术方法。文章未建立新的患者样本队列,而是选取近期已发表的纤维肌痛RCTs作为说明性案例,比较重复测量方差分析与线性混合模型在ITT框架、受试者内相关性建模、不平衡数据处理及缺失数据纳入方面的差异;同时结合SPSS软件给出LMMs的分步实施路径,并讨论极大似然(ML)与限制性极大似然(REML)在模型拟合中的适用情境。

以下按照正文内容与小标题进行结果解读。

Implementing linear mixed models in SPSS: a step-by-step guide

在这一部分中,研究人员将文章从理论讨论推进到实践层面,提供了在SPSS中实施LMMs的简化流程。通过“Analyze > Mixed Models > Linear”路径,设置受试者标识、定义受试者内变量如时间、选择协方差结构、指定因变量与分组和时间因素、添加固定效应以及组别×时间交互项,并进一步纳入随机截距或必要时随机斜率,以刻画个体内变异。研究人员还建议提取估计边际均值并进行事后比较,以便呈现组间、时间及交互效应。这一部分得出的结论是,LMMs并非仅限于高级统计学环境中的复杂工具,借助临床研究者常用的SPSS亦可较规范地实现,从而降低方法推广障碍。与此同时,文章指出SPSS在MAR假设下可通过极大似然估计纳入部分观测数据,减少整例删除的需要,但模型是否合理仍依赖协方差结构、固定与随机效应设定及诊断过程。

除上述明确小标题部分外,正文还围绕若干核心结果展开。首先,研究人员通过近年纤维肌痛RCTs实例说明,当前领域内次优统计方法仍较常见,具体表现为对不完整数据受试者的排除、使用修正ITT替代更完整的ITT思路,以及以ANOVA为基础的重复测量分析替代更灵活的纵向模型。通过对这些研究设计与分析策略的讨论,文章表明此类做法可能削弱治疗效应估计的稳定性,并加重因失访带来的解释偏差。

其次,研究人员论证了LMMs在不完整纵向数据场景中的适用性。通过方法学比较可知,LMMs能够显式处理受试者内相关性,容纳不平衡设计,并在MAR假设下利用所有可用观测值,因此通常较传统重复测量ANOVA更适合存在失访与多时间点重复观测的RCT数据。尤其在纤维肌痛这类症状随时间波动且疗效异质性明显的疾病中,LMMs更有助于估计时间×组别交互效应,并更全面地反映治疗效应的时间演变。

再次,文章并未将LMMs绝对化,而是强调其适用前提与局限。研究人员指出,LMMs的表现高度依赖MAR假设,而在纤维肌痛研究中,缺失可能与疼痛发作、疲劳严重程度、心理痛苦或治疗反应不足有关,此时不可排除非随机缺失(Missing Not At Random, MNAR)机制。通过这一讨论,文章得出结论:LMMs虽较传统方法更具方法学优势,但其结果仍需结合缺失机制的合理性审查、敏感性分析及模型诊断谨慎解释。若模型设定错误,或仅依赖软件默认选项而忽视协方差结构比较、固定与随机效应选择及分布假设检验,仍可能导致有偏或低效估计。

此外,研究人员指出,现代重复测量ANOVA并非完全停留在早期形式,一些实现方式也可结合多重插补(multiple imputation)或极大似然策略处理缺失数据。因此,ANOVA与LMM并非绝对对立关系,分析方法的恰当性仍应由研究问题、数据结构、缺失机制及统计能力共同决定。尽管如此,在多数纤维肌痛纵向RCT场景中,LMMs仍被认为具有更高灵活性与现实适配性。

在讨论部分,文章集中强调统计方法选择不仅是技术问题,也是研究严谨性与解释责任的问题。纤维肌痛患者群体疾病负担较重,若因分析方法不当造成治疗效应高估或低估,可能导致临床解释不一致,并进一步影响治疗决策与证据使用。研究人员因此提出,改善统计学规范性应成为纤维肌痛RCTs的重要优先事项,而不应被视为次要分析细节。与此同时,任何统计模型都无法完全弥补试验实施质量不足、随访程序不完善或信息性失访系统存在等问题,因此减少缺失数据本身仍是试验设计与执行中的关键任务。文章还结合当前监管与方法学框架指出,处理缺失数据时应明确估计目标(estimand),并使统计分析与临床问题保持一致。

研究结论部分可译为:方法学建议与纤维肌痛RCTs实际分析实践之间持续存在的差距,可能削弱治疗效应估计的可解释性与可靠性。对于涉及不完整随访数据的纵向分析,线性混合模型(LMMs)在与研究设计特征及现有统计专业能力相匹配时,可能代表一种更灵活且方法学上更为恰当的分析方法。提升该领域统计分析的严谨性,对于支持更可靠的临床解释与循证决策仍然至关重要。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号