HIV感染患者口服及肌内给药期间卡博特韦群体药代动力学模型的外部评价

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《CPT: Pharmacometrics & Systems Pharmacology》：External Evaluation of Population Pharmacokinetic Models of Cabotegravir, During Its Oral and Intramuscular Administration in HIV-Infected Patients

【字体：大中小】 时间：2026年05月23日 来源：CPT: Pharmacometrics & Systems Pharmacology 3

编辑推荐：

　　卡博特韦（cabotegravir，CAB）与利匹韦林（rilpivirine）联用，是首个获批用于HIV-1维持治疗的长效注射疗法。尽管该方案改善了治疗依从性和患者满意度，药代动力学（pharmacokinetics，PK）变异性仍然是一个值得关注的问题。目

卡博特韦（cabotegravir，CAB）与利匹韦林（rilpivirine）联用，是首个获批用于HIV-1维持治疗的长效注射疗法。尽管该方案改善了治疗依从性和患者满意度，药代动力学（pharmacokinetics，PK）变异性仍然是一个值得关注的问题。目前已建立两种群体药代动力学（population pharmacokinetic，PopPK）模型：一种基于I–III期临床试验数据，另一种基于常规临床数据。然而，这两种模型均未经过系统而充分的外部评价。本研究旨在利用独立的前瞻性数据集评估这些模型的预测性能，从而判断其是否适用于支持模型引导精准给药（model-informed precision dosing，MIPD）。研究人员采用法国观察性多中心（n = 14）ANRS0255 CARLAPOP研究的数据进行外部验证，该数据集包括736例HIV感染患者，共2192个浓度测定值。模型使用MONOLIX软件实现，并通过拟合优度（goodness-of-fit）、基于预测的诊断方法以及基于模拟的诊断方法进行评价。对于Han模型，在肌内给药后的血浆浓度预测中，预测中位误差（Median Prediction Error，MDPE）为?1.2%（PRED）和?4.4%（IPRED）；预测中位绝对误差（Median Absolute Prediction Error，MDAPE）为36.6%（PRED）和17.9%（IPRED）。对于Thoueille模型，MDPE分别为?24.2%（PRED）和?9.2%（IPRED）；MDAPE分别为39.0%（PRED）和15.3%（IPRED）。然而，两种模型中误差落在20%范围内的预测比例均低于70%。对Thoueille模型的图形分析显示其存在系统性偏倚，尤其见于女性、非吸烟者以及体重指数较高的患者。因此，在本研究人群中，两种模型均不足以被认为可靠到可用于MIPD。尽管Han等建立的模型显示出更高的预测性能，但在其能够可靠应用于日常临床MIPD之前，仍需进一步改进。

本研究发表于《CPT: Pharmacometrics》，核心目标是对卡博特韦（cabotegravir，CAB）群体药代动力学（population pharmacokinetic，PopPK）模型开展严格的外部评价，以判断其能否支持HIV感染者长效治疗中的模型引导精准给药（model-informed precision dosing，MIPD）。研究背景在于，CAB与利匹韦林联合构成首个用于HIV-1维持治疗的长效（long-acting，LA）注射双药方案，虽显著改善了依从性与治疗满意度，但其体内暴露存在明显个体间差异。既往III期研究及真实世界观察均提示，治疗早期血浆药物浓度偏低可能与病毒学失败风险相关，而疗效所需的最佳浓度阈值尚未形成一致意见。在这一背景下，PopPK模型被视为连接治疗药物监测（therapeutic drug monitoring，TDM）与个体化剂量优化的重要工具。然而，模型能否在临床真实环境中迁移应用，关键取决于是否经过独立外部数据集验证。此前虽已有两个CAB PopPK模型问世，但尚缺乏针对真实世界前瞻性队列的系统外部评估，因此开展本研究具有直接的临床方法学意义。

目前存在的主要问题包括：第一，CAB长效肌内制剂具有典型的翻转动力学（flip-flop kinetics），吸收过程而非消除过程成为药物处置的限速步骤，使模型对吸收参数、注射技术及个体差异极为敏感；第二，已发表模型虽识别出性别、体重指数（body mass index，BMI）、体重、吸烟状态等协变量，但不同模型对这些因素的作用方向和效应强度并不完全一致；第三，模型多建立于临床试验或单中心常规监测数据，可能无法充分反映真实世界中的给药异质性、随访节奏差异及更复杂的药代变异；第四，如缺乏可靠外部验证，模型在MIPD中的应用可能导致错误的先验预测，从而影响临床决策。因此，研究人员以独立前瞻性多中心真实世界队列检验模型泛化能力，具有较高的实用价值。

研究人员使用法国多中心观察性ANRS0255 CARLAPOP研究数据，对两个已发表的CAB PopPK模型进行外部评价：其一为Han等模型，来源于I–III期临床试验数据；其二为Thoueille等模型，来源于日常临床TDM数据。CARLAPOP共纳入736例HIV感染患者，来自14个中心，获得2192个血浆浓度值，其中296个来自口服给药期，1896个来自肌内注射期。研究重点放在肌内给药阶段，因为绝大多数样本和真实临床关切均集中于长效注射维持治疗。结果显示，两模型在若干稳健指标上具有一定可接受性，但均未达到支持MIPD所需的可靠程度。总体而言，Han模型的表现优于Thoueille模型，前者对总体浓度分布的描述较好，后者则表现出较明显的系统性低预测偏倚，尤其在女性、非吸烟者以及较高BMI患者中更为突出。研究结论是：现有两种模型均不宜直接用于本研究人群中的MIPD；其中Han模型较具潜力，但仍需进一步优化，并应结合更丰富的真实世界数据进行更新。

研究的重要意义在于，该研究并非重新建模，而是在“模型可迁移性”和“真实世界适用性”层面对现有CAB PopPK模型进行临床可实施性检验。研究结果提示，仅凭开发阶段良好的内部评价或临床试验人群中的外部表现，并不足以保证模型在真实世界中的个体预测能力。对于长效抗逆转录病毒治疗而言，若未来希望依托TDM与Bayes估计器开展MIPD，则必须建立能够覆盖更广人群特征、吸收差异与临床场景的新一代模型。

方法概括：研究使用法国ANRS0255 CARLAPOP前瞻性观察性多中心队列（14中心，736例HIV感染患者，2192个浓度值）作为独立外部验证集。两种已发表PopPK模型在MONOLIX中按原始参数直接实现，不进行重新估计。对低于定量下限（lower limit of quantification，LLOQ）的浓度按左删失数据处理。缺失协变量采用K近邻法插补。模型评价包括拟合优度图、基于预测的误差指标〔MDPE、MDAPE、MPE、RMSPE、F20等〕以及基于模拟的预测校正可视化预测检验（prediction-corrected visual predictive check，pcVPC）和标准化预测分布误差（normalized prediction distribution errors，NPDE）分析。

以下结合论文结果部分的小标题，对主要发现进行解读。

3.1 Patient Population and Plasma Drug Concentrations
该部分描述了外部验证数据集的构成及其药物浓度特征。研究共纳入736例患者，中位年龄46岁，男性占79%。BMI分布显示32%为超重，11%为肥胖。57%的患者接受了口服导入阶段。吸烟状态缺失约12%，体重与身高缺失比例较低。值得注意的是，本队列中未进行分次注射。药物浓度方面，共获得2192个CAB血浆浓度值，其中绝大多数来自肌内注射阶段，且84%的肌内样本为谷浓度。每位患者中位采样次数为3次。研究还观察到较大的个体间变异（interindividual variability，IIV），范围约为55%–72%，与既往该队列报道一致。仅有6个肌内样本低于LLOQ，其中半数采集于停药后6个月以上。该部分结果说明，本研究外部验证所用数据具有鲜明的真实世界特征：采样稀疏、以谷浓度为主、个体变异较大，这种数据结构对模型的泛化能力提出了更严格要求。

3.2 External Evaluation
该部分是全文核心，围绕两个模型分别评价其在真实世界队列中的外部预测性能。

3.2.1 Han Et al.'s Model
研究人员发现，Han模型在肌内给药情境下的整体表现较好。拟合优度图显示，模型预测值与观察值一致性较高，局部加权回归曲线与恒等线贴近，个体加权残差（individual weighted residuals，IWRES）围绕零对称分布，未见明显随时间或预测值变化而系统偏移。这说明该模型在总体结构上较能再现真实世界中的CAB浓度变化。

在定量指标方面，Han模型对肌内给药浓度的群体预测（PRED）MDPE为?1.2%，个体预测（IPRED）MDPE为?4.4%，提示偏倚较小；IPRED的MDAPE为17.9%，显示个体层面的精密度尚可。但F20仅为54.9%，远低于研究预设的80%可接受阈值，意味着虽然模型中位误差不大，但仍有相当比例的个体预测误差超过20%。换言之，该模型可较好描述总体趋势，却不足以为临床个体给药调整提供稳定可靠的先验支持。

进一步的pcVPC分析显示，Han模型大体能够覆盖观测浓度的整体分布，但在首次注射后及较高浓度区域存在一定偏离。分层pcVPC提示，该模型在不同体重、BMI、性别和吸烟状态亚组中的表现较为一致，没有出现某一亚组的显著系统性失真。NPDE分布也接近理论正态分布，说明其总体预测分布合理，但仍可见部分高浓度被低估。综合来看，Han模型是两者中外部表现更优的模型，但距离MIPD所需的个体层面可接受性仍有差距。

3.2.2 Thoueille Et al.'s Model
与Han模型相比，Thoueille模型虽然某些中位误差指标看似尚可，但图形诊断揭示了更明显的系统性问题。其PRED的MDPE为?24.2%，IPRED的MDPE为?9.2%；IPRED的MDAPE为15.3%，提示在个体后验拟合下精密度表面上尚可。然而其F20仅为68.4%，仍低于可接受界值，说明预测可接受比例不足。

更关键的是，该模型在图形层面表现出持续的低预测偏倚。群体预测中，大多数浓度被低估；个体预测中，低浓度区间出现高估，而随浓度升高又逐渐转为低估，提示模型结构或参数化不能一致描述不同暴露水平。IWRES分布呈正偏，也支持模型对高浓度的系统性低估。pcVPC中，观察值经常位于预测区间之上，NPDE直方图明显向正值偏移，说明模型预测分布与真实观测不匹配，并存在系统误差。

分层分析进一步表明，Thoueille模型在多个亚组中表现较差，尤其是高体重、高BMI、女性和非吸烟者。作者特别指出，在女性和非吸烟者中，模型预测准确性下降更明显。这一结果与该模型对性别和BMI协变量效应的设定，以及未纳入吸烟状态这一可能影响清除的因素有关。论文同时说明，口服给药阶段两模型总体表现尚可，因此外部验证中最主要的问题集中于长效肌内制剂阶段，也即CAB临床应用中最需要精准预测的部分。

讨论部分对上述结果进行了方法学与临床层面的整合。研究人员指出，当前尚缺乏PopPK模型外部评价的统一指南，不同研究对偏倚和精密度阈值的定义并不一致，因此本研究同时采用多类指标与图形诊断，避免单一指标造成误判。作者特别强调，MPE与RMSE等参数型指标容易受到极端值影响，而MDPE、MDAPE和F20等非参数指标更稳健。本研究中，部分低于LLOQ的浓度导致极端预测误差，移除这些值后，两个模型的MPE和RMSPE均明显改善，说明少数异常值即可显著扭曲参数型评价结果。这一分析提示，在外部验证中必须综合使用多种诊断工具。

对于两模型性能差异，论文从研究对象、数据类型、模型结构和协变量设定四方面作出解释。Han模型建立于临床试验数据，样本量大、采样丰富、可支撑双室模型，对吸收与分布过程的刻画更细；但试验条件标准化较强，可能低估真实世界变异。Thoueille模型虽源于真实世界TDM数据，更接近本研究场景，但样本量较小且为单中心，以稀疏数据为主，可能不足以完整捕捉复杂分布动力学，因此采用一室模型。论文指出，一室模型会导致表观终末斜率更陡，这与Thoueille模型更高的肌内吸收速率常数有关。两模型虽均保留性别和BMI对长效吸收速率常数的影响，但效应大小差异显著，尤其Thoueille模型对高BMI的影响更强，这可能是其在高BMI人群中低预测偏倚更明显的重要原因。

论文还总结了协变量层面的启示。Han模型纳入了注射技术因素，如针长与分次注射，并纳入吸烟状态对清除的影响；这些因素在真实世界中具有生物学合理性，因为针长可能影响药物是否真正进入肌肉组织，而吸烟可能诱导UGT1A1，进而增加CAB清除。Thoueille模型因缺乏相关数据，未能评估吸烟状态和针长影响，这被认为可能是其在非吸烟者等亚组预测欠佳的原因之一。此外，Thoueille模型虽估计了清除的时期间变异（inter-occasion variability，IOV），但吸收阶段数据不足，无法对长效吸收的IOV进行建模，也可能削弱模型对个体注射间差异的刻画能力。

综合讨论可得，研究人员并不支持将这两个现有模型直接用于本研究人群的MIPD。虽然Han模型在总体CAB药代动力学描述上优于Thoueille模型，但其个体可接受预测比例仍不足；Thoueille模型则存在更明显的系统偏倚。研究结论部分可译述为：Thoueille等建立的模型表现出系统性偏倚；Han等建立的模型虽对CAB药代动力学的总体描述具有更高预测性能，但在MIPD应用方面仍需进一步改进。若能整合既往已发表模型的数据与更丰富的真实世界数据（如本队列），构建经调整或更新的模型，预计将提升模型的可迁移性。优化后的模型不仅可用于描述CAB的药代—药效学（pharmacokinetic–pharmacodynamic，PK–PD）关系，还可用于验证TDM中的治疗浓度阈值；从长远看，这类模型可进一步嵌入Bayesian估计器或机器学习算法，以支持HIV感染者治疗优化。

总体而言，这项发表于《CPT: Pharmacometrics》的研究提供了一个具有代表性的范例：即使是已发表且具有一定内部或外部验证基础的PopPK模型，在进入真实世界MIPD应用前，仍必须接受独立、多中心、前瞻性数据集的严格检验。该研究的直接贡献不在于提出新模型，而在于明确指出现有CAB模型在真实世界临床精准给药中的边界与不足，并为后续模型更新、TDM阈值验证以及个体化长效抗HIV治疗策略奠定了证据基础。

联系信箱：

粤ICP备09063491号

热点排行