一种新型全自动免疫测定系统在五种肿瘤标志物检测中的性能验证与临床一致性研究：与国际参考平台的比较

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Practical Laboratory Medicine》：Performance Validation and Clinical Concordance of a Novel Fully Automated Immunoassay System for Five Tumor Markers: A Comparative Study with an International Reference Platform

【字体：大中小】 时间：2026年05月10日 来源：Practical Laboratory Medicine 1.3

编辑推荐：

　　王若冰|刘建民|曹婷|乔晓翰|邓欣宇|熊天环|楊瑶瑶|張俊杰|李敏|梁伟宁波大学第一附属医院实验医学系，中国宁波315000 **摘要** 由于进口检测平台的高成本，资源有限的地区难以广泛开展肺癌风险分层工作。本研究基于CLSI指南，对一种新型自动化荧光免疫测定系

　　王若冰|刘建民|曹婷|乔晓翰|邓欣宇|熊天环|楊瑶瑶|張俊杰|李敏|梁伟
宁波大学第一附属医院实验医学系，中国宁波315000

**摘要**
由于进口检测平台的高成本，资源有限的地区难以广泛开展肺癌风险分层工作。本研究基于CLSI指南，对一种新型自动化荧光免疫测定系统（Health）进行了初步的分析验证，该系统可用于检测五种肿瘤标志物（SCC、CEA、CYFRA21-1、Pro-GRP和NSE），并与现有的参考系统进行比较。

**方法**
根据CLSI EP建议，验证了该系统的分析精度，并将其与罗氏（Roche）、雅培（Abbott）和贝克曼（Beckman）平台进行了方法比较。共纳入180名肺癌患者和77名健康对照组。通过接收者操作特征（ROC）曲线分析评估了单个肿瘤标志物及其联合使用的诊断性能。

**结果**
该系统在所有分析物上均表现出良好的精度，运行内和总变异系数（CV）均低于6.8%。与参考平台相比，该系统在定量（r > 0.98）和定性一致性（Kappa > 0.93）方面具有较高的水平。多个标志物的联合检测部分弥补了单个标志物（如SCC，灵敏度为4.0%）的不足，使整体诊断性能提升至中等水平（AUC = 0.731）。统计比较显示，该系统的组合AUC低于罗氏平台（0.895，P < 0.001），但与雅培平台相当（0.782，P > 0.05），同时保持了相对较高的特异性（>90%）。

**结论**
经过初步验证，该系统表现出可接受的分析性能和满意的参考一致性。虽然它是一种经济有效的初步风险评估辅助工具，但其临床应用仍需外部验证。

**引言**
肺癌是全球最常见的恶性肿瘤之一，也是癌症相关死亡率的主要原因。早期诊断对改善患者预后至关重要。作为肺癌负担较重的国家，中国2022年报告了约871,000例新病例；然而，早期诊断率仍低于20%。血清肿瘤标志物（TMs）因其无创性和适合动态监测的特点，已成为基于影像学风险分层的有效补充手段。其中，细胞角质蛋白19片段（CYFRA21-1）用于非小细胞肺癌（NSCLC），癌胚抗原（CEA）用于腺癌，胃泌素释放肽前体（Pro-GRP）和神经元特异性烯醇化酶（NSE）用于小细胞肺癌（SCLC），以及鳞状细胞癌抗原（SCC）用于鳞状细胞癌，在肺癌的组织亚型鉴别中具有明确的价值。然而，单个肿瘤标志物的灵敏度和特异性有限。美国临床肿瘤学会（ASCO）建议采用多标志物联合检测策略，多项研究表明这种方法可将诊断敏感性提高到70%以上。目前广泛使用的国际免疫测定平台（如罗氏、雅培和贝克曼）成本较高且维护复杂，限制了其在基层医疗保健中的应用，从而限制了其作为肺癌风险分层和辅助诊断工具的潜力。

宁波健康生物医学有限公司（Ningbo Health BioMed Co., Ltd.）开发了五种荧光免疫测定试剂盒，用于定量检测肺癌相关的肿瘤标志物（SCC、CEA、CYFRA21-1、Pro-GRP和NSE）。这些试剂盒使用磁珠作为固相载体，以提高分离效率和反应动力学。这些试剂与贝克曼库尔特（Beckman Coulter）的DXI 800和Access 2自动化荧光分析仪以及Health公司开发的Gavin 300全自动荧光免疫分析仪兼容，为建立更具成本效益和便捷性的检测系统提供了可能。然而，现有研究主要局限于新系统与进口平台之间的简单线性相关性分析（如回归方程），未考虑不同系统之间的参考区间差异。此外，关于灵敏度、特异性和接收者操作特征曲线下面积（AUC）等诊断性能的全面评估仍然不足。

本研究根据CLSI EP系列指南（EP9-A3、EP12等）设计，系统地验证了新型荧光免疫测定系统的性能。通过精密实验评估了系统的重复性和稳定性，包括运行内和总变异系数（CV）。以雅培、贝克曼和罗氏平台作为参考方法，健康系统作为测试方法进行了方法比较。通过德明回归分析（斜率和相关系数）和布朗-阿尔特曼偏倚（Bland–Altman bias）分析评估了平台间的定量一致性，通过接收者操作特征曲线（ROC）和曲线下面积（AUC）计算评估了定性一致性，灵敏度、特异性和似然比，从而初步评估了单个肿瘤标志物及多标志物联合策略在肺癌检测中的诊断价值。研究结果为该新型肿瘤标志物检测系统的临床应用提供了基于证据的支持。

**材料与方法**
1. **研究人群**
本研究获得了宁波大学第一附属医院伦理委员会的批准（项目编号：2025-290A）。从宁波大学第一附属医院的临床实验室收集了非孕妇成年患者的新鲜血清样本。根据雅培、贝克曼和罗氏平台的现有检测结果，选择了不同浓度的样本进行方法可靠性和临床一致性分析。纳入标准为：2025年1月至2025年12月期间在宁波大学第一附属医院住院并病理学确诊为肺癌的患者，以及同期接受常规健康检查的随机选择的健康个体。共纳入180名肺癌患者，年龄22–80岁（平均58.0 ± 14.6岁），其中男性74人，女性106人。病理分类结果显示148例为腺癌，23例为鳞状细胞癌，9例为小细胞肺癌。肿瘤分期方面，146例为早期（0–II期），17例为晚期（III–IV期），17例因未接受手术治疗或其他临床因素而无法确定临床分期。肺癌组的纳入标准为：首次诊断且未接受过放疗、化疗或靶向治疗；血清样本在开始任何治疗前采集。排除标准包括：血液系统疾病、同时存在其他恶性肿瘤、严重的肝肾功能障碍或自身免疫性疾病。健康对照组由常规健康检查中随机选择的个体组成，纳入标准为：无恶性肿瘤史；影像学和实验室检查结果正常（包括全血细胞计数和肝肾功能检测）。最终，有77名健康对照组纳入最终分析，包括45名男性和32名女性，年龄范围23–82岁（平均年龄54.4 ± 14.5岁）。

2. **仪器和试剂**
本研究使用的肿瘤标志物检测试剂盒由宁波健康智能制造有限公司独立开发，配有相应的校准品和质量控制（QC）材料，并在Health公司的Gavin 300全自动荧光免疫分析仪上进行检测。作为参考系统，使用了罗氏电化学发光系统（Cobas e411）及其试剂盒、校准品和QC材料；雅培荧光系统（Abbott i1000s）及其试剂盒、校准品和QC材料；贝克曼荧光系统（DXI 800）及其试剂盒、校准品和QC材料。

3. **样本采集与检测**
从每位参与者处采集空腹静脉血样本（5 mL）。静置30分钟后，以3,000 r/min离心10分钟，然后将血清分装到Eppendorf管中，-80°C保存待测。测试前解冻一次，避免反复冻融（≤2次）。使用不同的免疫测定平台对五种肿瘤标志物进行定量检测。检测严格遵循相应试剂制造商提供的说明进行。每天使用高、中、低浓度的内部QC材料进行内部质量控制。只有当QC结果在可接受范围内时才进行临床样本检测。排除明显溶血、脂血症或黄疸的血清样本，以避免对NSE测定的干扰。

4. **数据分析**
数据分析使用SPSS 26.0版本。
- **精度验证**：根据CLSI EP15-A3指南，对健康系统进行了初步的精度验证（而非完整的CLSI EP05级验证）。分析了健康系统在高低低三种浓度下的肿瘤标志物QC材料，每天一个批次，每次测量间隔2小时，连续五天。期间每日进行常规QC，未重新校准。要求测试结果在QC目标范围内。计算运行内和总精度，并根据制造商的性能声明评估运行内和总变异系数（CV）。
- **定量相关性**：收集新鲜患者血清样本，确保浓度分布均匀。每个样本在健康系统和相应对比系统上分别检测两次，取两次结果的平均值。对比系统结果作为参考（X），健康系统结果作为测试方法（Y）。使用德明回归分析（模型II回归）获得回归方程（Y = aX + b）、皮尔逊相关系数（r）和95%置信区间（CI），并使用布朗-阿尔特曼图（Bland–Altman plot）进一步评估方法一致性，计算平均偏倚和95%一致性限（平均偏倚±1.96 SD）。
- **定性一致性**：根据1.4.2节的患者血清数据，健康系统和雅培、贝克曼、罗氏平台应用各自的参考范围。将参考范围内的样本归类为阴性，超出范围的样本归类为阳性。计算阴性一致性、阳性一致性、总体一致性、Kappa值和P值。使用Clopper-Pearson精确方法计算灵敏度和特异性的95%置信区间（CI）。

5. **结果**
- **精度**
表1显示，五种血清肿瘤标志物在三种浓度水平（低、中、高）下的运行内变异系数（CV）范围为2.99%至5.79%，运行间（总）CV范围为4.07%至6.74%。所有检测参数均满足制造商的性能声明要求，表明健康系统在本次初步验证范围内具有可靠的测量稳定性和重复性。
- **方法比较和德明回归分析**
德明回归分析显示，五种肿瘤标志物在所有测量范围内均呈现强线性相关性（r > 0.98）。回归参数的95%置信区间（CI）表明相对于参考平台存在一定程度的比例和恒定偏倚。对于CYFRA21-1，斜率和截距的95% CI分别为（0.896至1.162）和（-1.685至0.131），说明无显著系统差异。然而，对于Pro-GRP来说，斜率为1.146，95%置信区间（1.092至1.199）完全高于1.0，反映了比例偏差。在其他标志物中，CEA的截距为-7.274 ng/mL（95%置信区间：-10.330至-4.220），而SCC和NSE的截距95%置信区间同样不包括0，这提示在跨不同平台解释结果时需要谨慎考虑。表3。

表3. 五种肿瘤标志物在健康系统和参考平台之间的Deming回归分析和Pearson相关性。

| 标志物 | 参考系统 | 斜率（a） | 斜率的95%置信区间 | 截距（b） | 截距的95%置信区间 |
|------|--------|-----------|--------------|--------------|
| SCC | Abbott | 740 | 0.953 | 0.903至1.004 | 0.058至0.361 |
| CEA | Beckman | 164 | 1.045 | 1.000至1.091 | -7.274 | -10.330至-4.220 |
| CYFRA21-1 | Cobas | 103 | 1.029 | 0.896至1.162 | -0.777 | -1.685 |
| Pro-GRP | Cobas | 58 | 1.146 | 1.092至1.199 | 4.126 | -4.881 |
| NSE | Cobas | 89 | 0.927 | 0.849至1.006 | 1.886 | 0.721 |

注：Cobas是罗氏系统的商品名。

2.3. Bland-Altman一致性分析
Bland-Altman图展示了健康系统与参考平台之间的一致性（图1）。大多数数据点分布在±1.96标准差（SD）定义的一致性范围内。SCC、CEA、CYFRA21-1、Pro-GRP和NSE的平均偏差分别为0.031 ng/mL、-3.11 ng/mL、0.355 ng/mL、6.939 pg/mL和0.336 ng/mL。

下载：下载高分辨率图像（444KB）
下载：下载全尺寸图像

图1. Bland-Altman图显示了健康系统与参考试剂之间五种血清肿瘤标志物的一致性。

2.4. 定性一致性
使用定性一致性指标评估了健康系统与国际参考平台（Abbott i1000、Beckman DXI 800和Cobas e411）之间的定性一致性。五种测试肿瘤标志物的阳性百分比一致性（PPA）范围为92.86%至100.00%，阴性百分比一致性（NPA）范围为93.33%至100.00%。所有标志物的总体百分比一致性（OPA）范围为97.09%至98.28%。Kappa系数分析显示K值范围为0.938至0.952（所有P < 0.001），表明不同检测系统之间的定性结果具有高度一致性。表4。

表4. 健康系统与进口参考系统之间五种肿瘤标志物的定性一致性比较

| 标志物 | 参考系统 | PPA (%)（95% CI） | NPA (%)（95% CI） | 总一致性 (%) | Kappa（95% CI） |
|------|---------|--------------|--------------|------------|-------------|
| SCC | Abbott | 97.06（84.7–99.9） | 97.50（86.8–99.9） | 97.30 | 0.946（0.87–1.00） | <0.001 |
| CEA | Beckman | 99.19（95.6–100.0） | 93.33（81.7–98.6） | 97.62 | 0.938（0.88–1.00） | <0.001 |
| CYFRA21-1 | Cobas | 100.00（91.2–100.0） | 95.24（86.7–99.0） | 97.09 | 0.940（0.87–1.00） | <0.001 |
| Pro-GRP | Cobas | 92.86（66.1–99.8） | 100.00（92.0–100.0） | 98.28 | 0.952（0.86–1.00） | <0.001 |
| NSE | Cobas | 93.33（77.9–99.2） | 100.00（94.3–100.0） | 97.85 | 0.950（0.88–1.00） | <0.001 |

2.5. 诊断性能评估
本研究进行了ROC曲线分析，以评估五种血清肿瘤标志物的诊断性能。结果显示，健康系统检测到的SCC、CYFRA21-1、CEA、Pro-GRP和NSE的AUC分别为0.650、0.536、0.525、0.717和0.558。在最适操作点（OOP），健康系统的敏感性范围为4.0%至66.7%，特异性范围为66.2%至98.7%。各个标志物的诊断指数存在某些生物学限制；例如，健康系统的SCC检测在最佳临界值时显示出高特异性（98.7%）但灵敏度显著较低（4.0%）。同样，CYFRA21-1（0.536）和CEA（0.525）的AUC值接近0.5，表明单独使用时区分能力有限。多标志物组合模型提高了整体诊断性能，产生了中等的AUC 0.731。三种检测系统的详细诊断性能指标，包括Youden指数和比值比，在表5中总结。

表5. 候选系统与参考系统之间五种肿瘤标志物的诊断效果比较

| 标志物 | 系统 | AUC | 切断值 | 敏感性（Se%） | 特异性（Sp%） | Youden指数（YI） | +LR | -LR |
|---------|-----------|--------------|---------------|---------------|-----------------|----------------------|
| SCC | Cobas | 0.695 | 3.49 | 0.01 | 1.76 | 0.99 | 0.01 |
| | Abbott | 0.697 | 1.85 | 2.99 | 0.01 | 2.23 | 0.98 |
| | Health | 0.650 | 1.62 | 4.09 | 0.02 | 3.07 | 0.97 |
| | | 0.586 | 1.31 | 5.85 | 0.18 | 1.44 | 0.698 |
| | Abbott | 0.554 | 1.84 | 4.27 | 0.60 | 1.82 | 0.747 |
| | Health | 0.525 | 2.26 | 4.27 | 0.10 | 1.43 | 0.81 |
| | | 0.504 | 2.24 | 4.83 | 0.08 | 1.19 | 0.866 |
| | Cobas | 0.504 | 2.24 | 4.83 | 0.08 | 1.19 | 0.866 |
| | Abbott | 0.542 | 2.46 | 18.29 | 0.60 | 1.82 | 0.747 |
| | Health | 0.536 | 2.59 | 39.87 | 0.12 | 1.45 | 0.828 |
| | Cobas | 0.820 | 22.59 | 86.1 | 0.44 | 0.44 | 0.238 |
| | Abbott | 0.779 | 10.40 | 80.06 | 0.43 | 2.19 | 0.314 |
| | Health | 0.717 | 34.54 | 66.7 | 0.20 | 1.97 | 0.503 |
| | Cobas | 0.762 | 13.86 | 54.6 | 0.02 | 1.76 | 0.979 |
| | Abbott | 0.558 | 98.0 | 15.59 | 2.20 | 0.07 | 1.987 |

2.5. 为了进一步提高诊断准确性，本研究评估了五个标志物（SCC、CEA、CYFRA21-1、Pro-GRP和NSE）在三个平台上组合检测的性能。如图2f所示，组合诊断模型的性能优于大多数单个标志物。比较多标志物面板时，健康系统的AUC为0.731（95%置信区间：0.671–0.791），显著低于罗氏系统（AUC：0.895，95%置信区间：0.856–0.934；P < 0.001）。然而，健康系统与Abbott系统之间的诊断性能没有统计学上的显著差异（AUC：0.782，95%置信区间：0.720–0.845；P = 0.078）。表6显示了不同系统之间的诊断性能比较。

下载：下载高分辨率图像（690KB）
下载：下载全尺寸图像

图2. 不同检测系统下五种肿瘤标志物及其组合的ROC曲线。

图2表明了（a）SCC、（b）CEA、（c）CYFRA21-1、（d）Pro-GRP、（e）NSE以及（f）所有五个标志物组合的诊断灵敏度和特异性。红色实线代表健康（候选）系统，绿色虚线代表罗氏Cobas系统，蓝色实线代表Abbott系统。对角虚线表示AUC为0.5（无区分度）。多标志物面板的AUC值显示在面板（f）中。

表6. 不同系统之间的诊断性能比较

系统 | AUC（95%置信区间） | P值（与健康系统相比） |
|------------|----------------|-----------------|
| Health | 0.731（0.671–0.791） | - |
| Roche | 0.895（0.856–0.934） | <0.001 |
| Abbott | 0.782（0.720–0.845） | 0.078 |

讨论
本研究代表了对一种新型全自动化学发光免疫测定系统（Health）的初步分析验证，该系统用于五种肺癌肿瘤标志物的联合检测，遵循CLSI EP系列指南进行。然而，应承认分析评估中的几个局限性。本研究未包括线性、检测限（LoD）、定量限（LoQ）、携带效应或干扰测试等分析参数的全面验证。这些基础分析特性并未独立评估，而是依赖于制造商提供的性能声明。这些因素可能会影响实际实验室条件下的测定性能，特别是在涉及极端分析物浓度、潜在干扰或肿瘤患者长期监测的情况下。尽管存在这些局限性，观察到的精确度仍在制造商性能声明定义的可接受范围内，支持了该测定在常规实验室条件下的分析稳定性。未来的全面实验室评估应独立验证这些参数，特别是对于动态肿瘤患者监测。

定性结果与现有平台的高度一致（Kappa > 0.93，P < 0.001），Deming回归显示了强线性相关性（r > 0.98）。尽管存在这种总体一致性，但在Bland-Altman和Deming分析中观察到了系统性的定量偏差。具体来说，Deming回归显示出CEA的负截距（-7.274 ng/mL对比Beckman）和NSE的正截距（1.886 ng/mL对比Roche）。为了进一步探讨潜在影响，我们评估了临床相关浓度下的预期偏差。对于NSE，使用推导出的Deming方程（Y = 0.927X + 1.886），在罗氏诊断阈值16.3 ng/mL的样本，在健康系统上对应估计浓度为16.99 ng/mL。这表示在决策限处大约有0.7 ng/mL的正偏差（a +4.3%的相对偏移）。健康系统制造商推荐的临界值（17.0 ng/mL）似乎部分补偿了这种系统特定的校准偏差。相反，对于CEA，负截距（-7.274 ng/mL）和平均Bland-Altman偏差（-3.11 ng/mL）表明健康系统倾向于在低浓度时报告较低的绝对值。在传统的5.0 ng/mL临界值下，这种向下偏移代表了相对较大的偏差。如果应用通用的跨平台临界值而不进行调整，这些差异可能会影响临床解释，可能导致CEA的假阴性分类或NSE的假阳性结果。此外，在肿瘤患者的长期监测中，更换检测系统而不建立新的患者基线可能会导致对肿瘤标志物趋势的错误解释，例如错误地怀疑疾病进展或治疗失败。在免疫测定方法研究中，这种非零截距并不罕见，通常与不同制造商的试剂盒之间的抗体-表位识别差异以及校准可追溯性系统的不一致性有关。此外，Bland-Altman图中观察到的少数异常值可能与样本基质效应或异质性抗体的干扰有关。总体而言，尽管这些偏差的幅度相对有限，但它们强调了在不同分析平台之间互用结果时谨慎解释的重要性，特别是在临床相关决策阈值处。

就临床诊断性能而言，目前的发现进一步支持了多肿瘤标志物组合策略的潜在价值。例如，SCC在选定的临界值下显示出低诊断敏感性（4.0%）和AUC为0.650，表明有较大的漏诊风险，尤其是在生物标志物浓度低或边缘的情况下。相比之下，包括CYFRA21-1、CEA和NSE在内的多个标志物的联合评估部分提高了诊断性能，产生了0.731的AUC。这一结果与Wu等人的发现一致，他们报告多标志物策略可以降低漏诊率。同时，本研究中Pro-GRP（SCLC）和CYFRA21-1（NSCLC）观察到的特异性进一步证实了Korkmaz等人提出的亚型特定标志物组合在临床分类和诊断中的价值。使用DeLong检验的统计比较表明，评估系统的组合AUC显著低于罗氏平台（AUC = 0.895；95%置信区间：0.856–0.934；P < 0.001），但与Abbott平台相当（AUC = 0.782；95%置信区间：0.720–0.845；P = 0.078）。这种平台间的性能差距在一定程度上可能反映了基于不同检测技术的抗体-表位亲和力和抗干扰能力的差异。从临床角度来看，尽管总体AUC较低，但该组合的独立诊断能力仍然有限。虽然评估系统显示出高特异性（>90%）和相对于健康组的良好阳性比值比，但在其临床效用——特别是在人群筛查或早期检测设置中——必须谨慎对待。实际上，这些生物标志物结果不应作为独立的决定性工具，而应作为标准成像方法（如低剂量计算机断层扫描（LDCT）的辅助参考。

尽管有鼓舞人心的初步发现，但本研究中的几个方法学局限性要求对诊断性能进行谨慎解释。首先，新系统的最佳诊断临界值是在同一患者队列中推导并随后评估的。这种方法引入了统计过拟合的固有风险，可能导致该测定的性能看起来优于其在实际临床实践中的表现。其次，鉴于病例对照研究设计和缺乏良性疾病对照组，本研究中观察到的特异性可能被高估。这种二元比较人为地夸大了临床特异性，因为患有良性肺疾病的患者往往表现出升高的肿瘤标志物水平。此外，SCC的总体诊断敏感性在很大程度上取决于队列中鳞状细胞癌的比例（在本研究中仅占12.8%）。此外，早期肿瘤通常比晚期恶性肿瘤分泌较少的生物标志物。这些临床特征的不平衡——特别是腺癌和早期肿瘤在该魏良：撰写、审稿与编辑工作；项目监督；资源协调；项目管理工作；资金筹措；概念构思。张俊杰：项目监督；撰写、审稿与编辑工作。

伦理声明：
涉及人类参与者的研究已经过宁波大学第一附属医院伦理委员会的审查与批准（项目编号：2025-290A）。所有患者/参与者均亲自签署了书面知情同意书，同意参与本研究。

利益冲突：
作者声明，本研究在没有任何可能被视为利益冲突的商业或财务关系的情况下进行。

资金支持：
本研究得到了宁波市科学技术局重点研发计划的支持（项目编号：2022Z2202022）。

联系信箱：

粤ICP备09063491号

热点排行