《PLOS Pathogens》:Design and analysis of randomized clinical trials for onchocerciasis, loiasis and mansonellosis: A systematic review
编辑推荐:
这篇综述系统梳理了近25年来针对盘尾丝虫病、罗阿丝虫病及曼森线虫病的随机对照临床试验(RCT)的设计与分析方法。研究发现,相关试验在设计方案、主要终点选择、随访时长及统计方法上存在显著异质性,且部分试验报告透明度不足。文章建议采用ICH E9(R1)估计量框架(estimand framework)与CONSORT声明等标准化报告工具,以提高试验结果的可靠性与可比性,为未来针对这三种被忽视热带病(NTDs)的药物研发提供方法论参考。
引言:研究背景与挑战
盘尾丝虫病(又称河盲症)、罗阿丝虫病(非洲眼线虫病)和曼森线虫病是主要由丝虫类线虫(filarial nematodes)引起的被忽视热带病(Neglected Tropical Diseases, NTDs),对非洲、拉丁美洲等资源匮乏地区造成沉重健康负担。其临床试验设计与分析面临独特挑战:目标人群样本量通常有限,而关键疗效终点,如微丝蚴(microfilariae, mf)计数数据,常呈现严重的右偏态分布,并非正态分布。这些因素使得如何设计合适的统计方法、如何定义与分析主要终点,成为影响试验结论可靠性的关键问题。
材料与方法:系统评价策略
为梳理相关临床试验的设计与分析方法,研究团队在PubMed和四大临床试验注册平台进行了系统性检索,时间跨度为2000年至2024年。检索内容涵盖探讨上述三种疾病治疗方法的已发表或已注册的随机对照试验。研究排除了仅关注新方法或药代动力学、简短报告以及I期试验。最终,共有44项研究符合纳入标准,其中针对盘尾丝虫病的有23项,罗阿丝虫病16项,曼森线虫病5项。这些试验的信息来源于注册库、手稿和/或研究方案。研究提取了包括试验设计、主要终点、统计方法、样本量、分析人群在内的多项特征,并应用了国际人用药品技术要求协调理事会(International Council for Harmonisation, ICH)E9(R1)附录引入的估计量框架(estimand framework)来系统性地审视这些试验。
结果概览:显著异质性与报告透明度问题
检索过程共识别出268条记录,经过筛选和去重,最终有44项试验被纳入分析。结果揭示了试验间存在相当大的异质性。
- •
研究设计与样本量:所有试验均为优效性假设检验。在报告了计划样本量的36项试验中,计划参与者总数的中位数为166人。不同疾病的计划样本量存在差异,罗阿丝虫病试验的中位计划样本量最小(99人)。实际样本量的分布情况见箱线图:在分析人群方面,64%的试验未明确说明主要分析使用的是意向性治疗(Intention-To-Treat, ITT)分析还是符合方案集(Per-Protocol, PP)分析。
- •
干预与对照:试验中评估了多种干预措施,包括伊维菌素(ivermectin, IVM)、阿苯达唑(albendazole, ALB)、左旋咪唑、乙胺嗪(diethylcarbamazine, DEC)、多西环素(doxycycline, DOXY)等。对照组的设置因疾病而异:在罗阿丝虫病试验中,安慰剂是最常见的对照;而在盘尾丝虫病研究中,标准药物/剂量则是最常报告的对照。
- •
随机化与盲法:超过半数的试验报告了随机化程序的细节,其中分层随机化是最常报告的方法。双盲设计在试验中占主导地位,但开放性设计在盘尾丝病和曼森线虫病试验中也较为常见。
- •
主要终点与统计方法:在定义了主要疗效终点的31项试验中,定性终点与定量终点的使用频率相近,但在盘尾丝虫病试验中,定性终点(如达到预定mf清除阈值)的使用更为常见。针对定量主要终点,最常报告的假设检验方法是Mann-Whitney U检验或Kruskal-Wallis检验(非参数方法)。对于定性主要终点,卡方检验或Fisher精确检验是最常用的方法。混合效应模型等更复杂的多变量方法使用较少。尽管30项试验包含两个以上的研究组,但只有6项报告了控制族系误差率的方法。主要终点及完整试验的随访时长,以及主要终点时间点的数据缺失百分比见箱线图:
- •
估计量框架应用与报告完整性:只有eWHORM试验明确应用了估计量框架。对于其他试验,作者回顾性地从现有资料中提取相关信息。许多试验的报告存在信息稀疏、不一致或不完整的情况,突显了标准化、结构化透明报告的必要性。不同时间周期使用的定量与定性终点统计方法频率分布:
临床试验实例
文章选取了三种疾病及eWHORM试验的最新或代表性研究作为实例,具体说明了其设计、主要终点和统计方法:
- •
盘尾丝虫病:一项评估伊维菌素、乙胺嗪和阿苯达唑三联疗法(IDA)安全性与疗效的开放标签试验。主要安全性终点是治疗后7天内严重不良事件的发生率,使用卡方和Fisher精确检验进行比较。主要疗效估计量关注治疗组间在治疗18个月后子宫内仍存活且有胚胎的成年雌性盘尾丝虫比例差异,使用混合效应逻辑回归模型进行分析。
- •
罗阿丝虫病:一项评估阿苯达唑联合或不联合伊维菌素疗效的评估者盲法试验。主要估计量是在指定治疗下6个月内mf载量降至100 mf/mL以下的患者比例,主要进行描述性分析。
- •
曼森线虫病:一项评估多西环素疗效的开放标签II期试验。主要估计量是两组在12个月时曼森线虫mf载量的差异,使用Mann-Whitney U检验进行分析。
- •
eWHORM篮子试验:这是一项评估奥芬达唑(oxfendazole)疗效的适应性II期随机对照篮子试验,涵盖了上述三种疾病及鞭虫病。试验采用两阶段设计,计划进行中期分析以进行剂量选择和可能的样本量重新评估。主要分析基于修改后的意向性治疗人群,主要估计量的汇总指标是干预组与安慰剂组间寄生虫载量的一致性。
讨论:挑战与未来方向
本次系统评价揭示了相关临床试验在设计、尤其是可跨研究标准化的关键参数上存在显著异质性。这可能是由于药物作用模式、研究丝虫种类及靶向生命周期阶段不同所致。
- •
小样本量与随机化:丝虫病试验通常样本量较小,这增加了治疗组间基线不平衡的风险。采用分层区组随机化并在分析中纳入分层变量,有助于在小样本试验中改善协变量平衡。
- •
对照选择与回归均值:对照组(安慰剂/无治疗 vs. 活性对照)的选择取决于试验目标和伦理考量。基于高基线mf计数的入组标准可能导致“回归均值”现象,若无对照臂,则难以将这种自然波动与真实的治疗效果区分开。
- •
终点选择与数据分析:mf计数数据常呈现零膨胀与右偏态的混合分布。目前的试验多使用非参数秩和检验,这类方法虽稳健但不利用计数值本身的信息,且难以纳入预后协变量。未来可考虑使用能同时处理零膨胀和纵向数据的混合效应模型,如零膨胀混合模型,以提高统计效能和临床可解释性。
- •
多重性调整与适应性设计:许多试验涉及多组比较,但很少报告控制多重比较误差的方法。在确证性试验中,这会导致假阳性风险增加。此外,适应性设计(如eWHORM试验所用)可根据期中数据调整试验,提高效率,但需预先设定并采用能控制统计误差的分析方法。
- •
报告透明度与标准化:许多试验报告信息不完整,强调了采用ICH E9(R1)估计量框架和CONSORT声明等标准化报告工具的重要性,以提高透明度,并确保试验目标、分析和报告结论之间的一致性。
结论
本系统评价总结了盘尾丝虫病、罗阿丝虫病和曼森线虫病随机对照临床试验的设计与分析现状。尽管部分试验设计完善、报告详尽,但许多试验在报告透明度、关键方法学细节的完整性方面存在不足。未来研究应致力于采用更清晰的报告标准(如CONSORT和ICH E9(R1)),并在设计阶段充分考虑小样本量下的随机化策略、针对零膨胀偏态数据的适当统计模型、对多重比较的必要调整,以及对缺失数据的妥善处理。适应性设计为在资源有限的情况下高效评估新疗法提供了有前景的选择,但其应用需基于具体试验目标进行个案评估。