《CPT: Pharmacometrics & Systems Pharmacology》:External Evaluation of Population Pharmacokinetic Models of Cabotegravir, During Its Oral and Intramuscular Administration in HIV-Infected Patients
编辑推荐:
卡博特韦(cabotegravir,CAB)与利匹韦林(rilpivirine)联用,是首个获批用于HIV-1维持治疗的长效注射疗法。尽管该方案改善了治疗依从性和患者满意度,药代动力学(pharmacokinetics,PK)变异性仍然是一个值得关注的问题。目
卡博特韦(cabotegravir,CAB)与利匹韦林(rilpivirine)联用,是首个获批用于HIV-1维持治疗的长效注射疗法。尽管该方案改善了治疗依从性和患者满意度,药代动力学(pharmacokinetics,PK)变异性仍然是一个值得关注的问题。目前已建立两种群体药代动力学(population pharmacokinetic,PopPK)模型:一种基于I–III期临床试验数据,另一种基于常规临床数据。然而,这两种模型均未经过系统而充分的外部评价。本研究旨在利用独立的前瞻性数据集评估这些模型的预测性能,从而判断其是否适用于支持模型引导精准给药(model-informed precision dosing,MIPD)。研究人员采用法国观察性多中心(n = 14)ANRS0255 CARLAPOP研究的数据进行外部验证,该数据集包括736例HIV感染患者,共2192个浓度测定值。模型使用MONOLIX软件实现,并通过拟合优度(goodness-of-fit)、基于预测的诊断方法以及基于模拟的诊断方法进行评价。对于Han模型,在肌内给药后的血浆浓度预测中,预测中位误差(Median Prediction Error,MDPE)为?1.2%(PRED)和?4.4%(IPRED);预测中位绝对误差(Median Absolute Prediction Error,MDAPE)为36.6%(PRED)和17.9%(IPRED)。对于Thoueille模型,MDPE分别为?24.2%(PRED)和?9.2%(IPRED);MDAPE分别为39.0%(PRED)和15.3%(IPRED)。然而,两种模型中误差落在20%范围内的预测比例均低于70%。对Thoueille模型的图形分析显示其存在系统性偏倚,尤其见于女性、非吸烟者以及体重指数较高的患者。因此,在本研究人群中,两种模型均不足以被认为可靠到可用于MIPD。尽管Han等建立的模型显示出更高的预测性能,但在其能够可靠应用于日常临床MIPD之前,仍需进一步改进。
本研究发表于《CPT: Pharmacometrics》,核心目标是对卡博特韦(cabotegravir,CAB)群体药代动力学(population pharmacokinetic,PopPK)模型开展严格的外部评价,以判断其能否支持HIV感染者长效治疗中的模型引导精准给药(model-informed precision dosing,MIPD)。研究背景在于,CAB与利匹韦林联合构成首个用于HIV-1维持治疗的长效(long-acting,LA)注射双药方案,虽显著改善了依从性与治疗满意度,但其体内暴露存在明显个体间差异。既往III期研究及真实世界观察均提示,治疗早期血浆药物浓度偏低可能与病毒学失败风险相关,而疗效所需的最佳浓度阈值尚未形成一致意见。在这一背景下,PopPK模型被视为连接治疗药物监测(therapeutic drug monitoring,TDM)与个体化剂量优化的重要工具。然而,模型能否在临床真实环境中迁移应用,关键取决于是否经过独立外部数据集验证。此前虽已有两个CAB PopPK模型问世,但尚缺乏针对真实世界前瞻性队列的系统外部评估,因此开展本研究具有直接的临床方法学意义。
目前存在的主要问题包括:第一,CAB长效肌内制剂具有典型的翻转动力学(flip-flop kinetics),吸收过程而非消除过程成为药物处置的限速步骤,使模型对吸收参数、注射技术及个体差异极为敏感;第二,已发表模型虽识别出性别、体重指数(body mass index,BMI)、体重、吸烟状态等协变量,但不同模型对这些因素的作用方向和效应强度并不完全一致;第三,模型多建立于临床试验或单中心常规监测数据,可能无法充分反映真实世界中的给药异质性、随访节奏差异及更复杂的药代变异;第四,如缺乏可靠外部验证,模型在MIPD中的应用可能导致错误的先验预测,从而影响临床决策。因此,研究人员以独立前瞻性多中心真实世界队列检验模型泛化能力,具有较高的实用价值。
研究人员使用法国多中心观察性ANRS0255 CARLAPOP研究数据,对两个已发表的CAB PopPK模型进行外部评价:其一为Han等模型,来源于I–III期临床试验数据;其二为Thoueille等模型,来源于日常临床TDM数据。CARLAPOP共纳入736例HIV感染患者,来自14个中心,获得2192个血浆浓度值,其中296个来自口服给药期,1896个来自肌内注射期。研究重点放在肌内给药阶段,因为绝大多数样本和真实临床关切均集中于长效注射维持治疗。结果显示,两模型在若干稳健指标上具有一定可接受性,但均未达到支持MIPD所需的可靠程度。总体而言,Han模型的表现优于Thoueille模型,前者对总体浓度分布的描述较好,后者则表现出较明显的系统性低预测偏倚,尤其在女性、非吸烟者以及较高BMI患者中更为突出。研究结论是:现有两种模型均不宜直接用于本研究人群中的MIPD;其中Han模型较具潜力,但仍需进一步优化,并应结合更丰富的真实世界数据进行更新。
研究的重要意义在于,该研究并非重新建模,而是在“模型可迁移性”和“真实世界适用性”层面对现有CAB PopPK模型进行临床可实施性检验。研究结果提示,仅凭开发阶段良好的内部评价或临床试验人群中的外部表现,并不足以保证模型在真实世界中的个体预测能力。对于长效抗逆转录病毒治疗而言,若未来希望依托TDM与Bayes估计器开展MIPD,则必须建立能够覆盖更广人群特征、吸收差异与临床场景的新一代模型。
方法概括:研究使用法国ANRS0255 CARLAPOP前瞻性观察性多中心队列(14中心,736例HIV感染患者,2192个浓度值)作为独立外部验证集。两种已发表PopPK模型在MONOLIX中按原始参数直接实现,不进行重新估计。对低于定量下限(lower limit of quantification,LLOQ)的浓度按左删失数据处理。缺失协变量采用K近邻法插补。模型评价包括拟合优度图、基于预测的误差指标〔MDPE、MDAPE、MPE、RMSPE、F20等〕以及基于模拟的预测校正可视化预测检验(prediction-corrected visual predictive check,pcVPC)和标准化预测分布误差(normalized prediction distribution errors,NPDE)分析。
以下结合论文结果部分的小标题,对主要发现进行解读。
3.1 Patient Population and Plasma Drug Concentrations
该部分描述了外部验证数据集的构成及其药物浓度特征。研究共纳入736例患者,中位年龄46岁,男性占79%。BMI分布显示32%为超重,11%为肥胖。57%的患者接受了口服导入阶段。吸烟状态缺失约12%,体重与身高缺失比例较低。值得注意的是,本队列中未进行分次注射。药物浓度方面,共获得2192个CAB血浆浓度值,其中绝大多数来自肌内注射阶段,且84%的肌内样本为谷浓度。每位患者中位采样次数为3次。研究还观察到较大的个体间变异(interindividual variability,IIV),范围约为55%–72%,与既往该队列报道一致。仅有6个肌内样本低于LLOQ,其中半数采集于停药后6个月以上。该部分结果说明,本研究外部验证所用数据具有鲜明的真实世界特征:采样稀疏、以谷浓度为主、个体变异较大,这种数据结构对模型的泛化能力提出了更严格要求。
3.2 External Evaluation
该部分是全文核心,围绕两个模型分别评价其在真实世界队列中的外部预测性能。
3.2.1 Han Et al.'s Model
研究人员发现,Han模型在肌内给药情境下的整体表现较好。拟合优度图显示,模型预测值与观察值一致性较高,局部加权回归曲线与恒等线贴近,个体加权残差(individual weighted residuals,IWRES)围绕零对称分布,未见明显随时间或预测值变化而系统偏移。这说明该模型在总体结构上较能再现真实世界中的CAB浓度变化。
在定量指标方面,Han模型对肌内给药浓度的群体预测(PRED)MDPE为?1.2%,个体预测(IPRED)MDPE为?4.4%,提示偏倚较小;IPRED的MDAPE为17.9%,显示个体层面的精密度尚可。但F20仅为54.9%,远低于研究预设的80%可接受阈值,意味着虽然模型中位误差不大,但仍有相当比例的个体预测误差超过20%。换言之,该模型可较好描述总体趋势,却不足以为临床个体给药调整提供稳定可靠的先验支持。
进一步的pcVPC分析显示,Han模型大体能够覆盖观测浓度的整体分布,但在首次注射后及较高浓度区域存在一定偏离。分层pcVPC提示,该模型在不同体重、BMI、性别和吸烟状态亚组中的表现较为一致,没有出现某一亚组的显著系统性失真。NPDE分布也接近理论正态分布,说明其总体预测分布合理,但仍可见部分高浓度被低估。综合来看,Han模型是两者中外部表现更优的模型,但距离MIPD所需的个体层面可接受性仍有差距。
3.2.2 Thoueille Et al.'s Model
与Han模型相比,Thoueille模型虽然某些中位误差指标看似尚可,但图形诊断揭示了更明显的系统性问题。其PRED的MDPE为?24.2%,IPRED的MDPE为?9.2%;IPRED的MDAPE为15.3%,提示在个体后验拟合下精密度表面上尚可。然而其F20仅为68.4%,仍低于可接受界值,说明预测可接受比例不足。
更关键的是,该模型在图形层面表现出持续的低预测偏倚。群体预测中,大多数浓度被低估;个体预测中,低浓度区间出现高估,而随浓度升高又逐渐转为低估,提示模型结构或参数化不能一致描述不同暴露水平。IWRES分布呈正偏,也支持模型对高浓度的系统性低估。pcVPC中,观察值经常位于预测区间之上,NPDE直方图明显向正值偏移,说明模型预测分布与真实观测不匹配,并存在系统误差。
分层分析进一步表明,Thoueille模型在多个亚组中表现较差,尤其是高体重、高BMI、女性和非吸烟者。作者特别指出,在女性和非吸烟者中,模型预测准确性下降更明显。这一结果与该模型对性别和BMI协变量效应的设定,以及未纳入吸烟状态这一可能影响清除的因素有关。论文同时说明,口服给药阶段两模型总体表现尚可,因此外部验证中最主要的问题集中于长效肌内制剂阶段,也即CAB临床应用中最需要精准预测的部分。
讨论部分对上述结果进行了方法学与临床层面的整合。研究人员指出,当前尚缺乏PopPK模型外部评价的统一指南,不同研究对偏倚和精密度阈值的定义并不一致,因此本研究同时采用多类指标与图形诊断,避免单一指标造成误判。作者特别强调,MPE与RMSE等参数型指标容易受到极端值影响,而MDPE、MDAPE和F20等非参数指标更稳健。本研究中,部分低于LLOQ的浓度导致极端预测误差,移除这些值后,两个模型的MPE和RMSPE均明显改善,说明少数异常值即可显著扭曲参数型评价结果。这一分析提示,在外部验证中必须综合使用多种诊断工具。
对于两模型性能差异,论文从研究对象、数据类型、模型结构和协变量设定四方面作出解释。Han模型建立于临床试验数据,样本量大、采样丰富、可支撑双室模型,对吸收与分布过程的刻画更细;但试验条件标准化较强,可能低估真实世界变异。Thoueille模型虽源于真实世界TDM数据,更接近本研究场景,但样本量较小且为单中心,以稀疏数据为主,可能不足以完整捕捉复杂分布动力学,因此采用一室模型。论文指出,一室模型会导致表观终末斜率更陡,这与Thoueille模型更高的肌内吸收速率常数有关。两模型虽均保留性别和BMI对长效吸收速率常数的影响,但效应大小差异显著,尤其Thoueille模型对高BMI的影响更强,这可能是其在高BMI人群中低预测偏倚更明显的重要原因。
论文还总结了协变量层面的启示。Han模型纳入了注射技术因素,如针长与分次注射,并纳入吸烟状态对清除的影响;这些因素在真实世界中具有生物学合理性,因为针长可能影响药物是否真正进入肌肉组织,而吸烟可能诱导UGT1A1,进而增加CAB清除。Thoueille模型因缺乏相关数据,未能评估吸烟状态和针长影响,这被认为可能是其在非吸烟者等亚组预测欠佳的原因之一。此外,Thoueille模型虽估计了清除的时期间变异(inter-occasion variability,IOV),但吸收阶段数据不足,无法对长效吸收的IOV进行建模,也可能削弱模型对个体注射间差异的刻画能力。
综合讨论可得,研究人员并不支持将这两个现有模型直接用于本研究人群的MIPD。虽然Han模型在总体CAB药代动力学描述上优于Thoueille模型,但其个体可接受预测比例仍不足;Thoueille模型则存在更明显的系统偏倚。研究结论部分可译述为:Thoueille等建立的模型表现出系统性偏倚;Han等建立的模型虽对CAB药代动力学的总体描述具有更高预测性能,但在MIPD应用方面仍需进一步改进。若能整合既往已发表模型的数据与更丰富的真实世界数据(如本队列),构建经调整或更新的模型,预计将提升模型的可迁移性。优化后的模型不仅可用于描述CAB的药代—药效学(pharmacokinetic–pharmacodynamic,PK–PD)关系,还可用于验证TDM中的治疗浓度阈值;从长远看,这类模型可进一步嵌入Bayesian估计器或机器学习算法,以支持HIV感染者治疗优化。
总体而言,这项发表于《CPT: Pharmacometrics》的研究提供了一个具有代表性的范例:即使是已发表且具有一定内部或外部验证基础的PopPK模型,在进入真实世界MIPD应用前,仍必须接受独立、多中心、前瞻性数据集的严格检验。该研究的直接贡献不在于提出新模型,而在于明确指出现有CAB模型在真实世界临床精准给药中的边界与不足,并为后续模型更新、TDM阈值验证以及个体化长效抗HIV治疗策略奠定了证据基础。