《Twin Research and Human Genetics》:Methodological Quality of Studies Designed to Create Twin-Specific Neonatal Anthropometric Charts: A Systematic Review
编辑推荐:
本刊编辑推荐:为解决双胞胎与单胎宫内生长差异导致使用单胎生长曲线评估双胞胎体型时存在过度诊断SGA(小于胎龄儿)的问题,研究人员对旨在建立双胞胎特异性新生儿人体测量曲线(anthropometric charts)的研究进行了首次系统性方法学质量评价。结果表明,现有68项研究普遍存在重大方法学缺陷(如仅9%为前瞻性设计,34%可靠评估孕周GA),绝大多数为参考曲线(reference charts)而非标准曲线(standards),限制了其临床应用的可靠性。该综述为未来建立高质量国际双胞胎新生儿生长标准提供了关键方法学指导。
在新生儿医学领域,准确评估婴儿出生时的体型至关重要,这通常依赖于根据孕周(Gestational Age, GA)制定的人体测量生长曲线(anthropometric charts)。这些曲线是区分婴儿为小于胎龄儿(Small for Gestational Age, SGA)、适于胎龄儿(Appropriate for Gestational Age, AGA)或大于胎龄儿(Large for Gestational Age, LGA)的关键工具。然而,一个长期存在的争议点在于,双胞胎胎儿是否应该使用与单胎相同的生长标准。大量证据表明,双胞胎与单胎的宫内生长从妊娠第28-30周开始出现分歧,导致双胞胎出生时体型显著小于单胎。这种差异被认为是双胎妊娠的生理性生长调节所致,但也可能被多胎妊娠相关病理因素放大。更重要的是,预测新生儿死亡率和发病率的出生体重阈值在双胞胎和单胎之间是不同的,双胞胎的阈值通常更低。许多根据单胎曲线被判定为SGA的双胞胎,并未表现出新生儿死亡或发病风险的增加。因此,使用单胎曲线评估双胞胎,可能导致SGA的过度诊断,进而引发不必要的医疗干预、资源浪费以及父母焦虑。研究者们由此提出,评估双胞胎出生体型时应优先使用双胞胎特异性生长曲线,这有助于医疗保健提供者判断生长受限是源于双胎妊娠本身的生理调节,还是其他病态因素,这对于早产双胞胎,尤其是晚期早产儿的精准营养管理和并发症监测尤为重要。
尽管已有大量针对双胞胎的新生儿生长曲线被开发出来,但它们的构建基于不同人群、采用各异的方法学,其质量参差不齐,严重影响其在临床实践中的适用性。此前,缺乏对这些研究的方法学质量进行的系统性、严格评估。为此,由Sonia Deantoni和Serena Gandino作为共同第一作者,Francesca Giuliani作为通讯作者的研究团队在《Twin Research and Human Genetics》上发表了题为“Methodological Quality of Studies Designed to Create Twin-Specific Neonatal Anthropometric Charts: A Systematic Review”的系统评价研究,首次全面审视了旨在创建双胞胎特异性新生儿人体测量曲线的研究的方法学质量。
为开展此项研究,研究人员遵循了系统评价和观察性研究Meta分析(MOOSE)报告规范,并在PROSPERO进行了注册。他们采用了混合检索策略,系统检索了包括Cinahl、Embase、Global Index Medicus、PubMed、Scopus、Web of Science在内的多个电子数据库以及Google Scholar等灰色文献资源,并进行了滚雪球式检索,时间跨度为1990年1月至2024年4月。两位评审员独立筛选文献,最终纳入68项符合条件的研究(即那些旨在制定双胞胎出生时横断面人体测量曲线的研究)。数据提取和研究质量评估由两位评审员独立完成,并使用一个包含18个条目的评分系统进行评估,这些条目涵盖研究设计、统计方法和结果报告三个领域。
研究结果揭示了现有双胞胎特异性新生儿生长曲线研究普遍存在显著的方法学异质性和局限性:
1. 研究设计与人群特征
纳入的68项研究在发表时间、地域分布、样本量(中位数8454,范围80至1,346,477)和涵盖的孕周范围上存在很大差异。75%的研究仅报告了出生体重(Birth Weight, BW),同时包含出生体重、身长(Birth Length, BL)和头围(Head Circumference, HC)这三项关键指标的研究仅占21%。绝大多数(67项,99%)研究构建的是参考曲线(reference charts,描述特定人群在现有条件下的实际生长情况),而非标准曲线(standards,描述在理想条件下应如何生长),仅有一项研究(Bossi等,1994)符合标准曲线的定义。研究方法学上的主要缺陷包括:仅9%的研究为前瞻性设计;超过一半(53%)回顾性使用出生登记数据;34%的研究采用了可靠的孕周评估方法(如结合末次月经和早孕期超声);仅18%的研究评估了绒毛膜性(chorionicity),其中仅8项研究按绒毛膜胎盘类型分别制定了曲线;在人体测量评估方面,仅19%的研究报告并使用了可靠的测量仪器,28%描述了可靠的测量技术,仅6%报告了对操作者进行了培训。
2. 统计方法
统计方法是构建可靠生长曲线的核心。近一半(46%)的研究统计模型不恰当或描述不充分。虽然49%的研究使用了回归模型(如LMS法)估计生长曲线,但仅3%使用了更先进的贝叶斯模型等特设方法。29%的研究对异常值进行了充分评估和处理。26%的研究未按性别分层或未考虑性别作为协变量,未制作性别特异性曲线。评估模型拟合优度(goodness of fit)的研究仅占16%。63%的研究以某种形式报告了估计值的精确度(如标准误、置信区间)。46%的研究报告使用了平滑技术(smoothing techniques)以获得平滑的百分位数曲线。
3. 结果报告与总体质量
结果报告的完整性也显不足:44%的研究报告了研究人群的特征;82%的研究报告或可计算第10、50、90百分位数;50%的研究报告或可计算Z分数。总体方法学质量评分(基于18个条目)的中位数仅为44%(四分位距IQR为33%-61%,范围11%-83%)。仅38%的研究总体质量评分高于50%,而同时在研究设计、统计方法和结果报告三个领域评分均高于50%的研究仅占15%。风险偏倚最高的项目包括出生体重差异(birth weight discordance)的确定(91%高风险)、人体测量评估(84%高风险)、绒毛膜性确定(82%高风险)和拟合优度评估(84%高风险)。
本研究通过系统、严格的评价,首次揭示现有双胞胎特异性新生儿人体测量曲线研究存在显著的方法学局限性,严重影响了其结果的可靠性和临床适用性。这些曲线绝大多数为基于特定地区和时间点的参考曲线,而非国际通用的标准曲线,限制了不同人群间的比较和国际层面的应用。该综述不仅指出了当前研究的不足,更重要的是,它提出的方法学质量评估清单为未来开展高质量的双胞胎新生儿生长曲线研究提供了明确的指导框架。开发高质量的国际双胞胎新生儿生长标准,对于在全球范围内对双胞胎进行准确的人体测量评估,避免单胎曲线带来的过度诊断和干预,优化双胞胎的临床管理和健康结局具有极其重要的意义。随着辅助生殖技术的普及,双胎妊娠率上升,对此类高质量标准的需求将愈发迫切。
(论文解读文章完,字数约2000字)