癌症患者参与药物临床试验的态度与意愿:多阶段定性研究
《Journal of Medical Internet Research》:Attitudes and Willingness to Participate in Drug Clinical Trials Among Patients With Cancer: Multistage Qualitative Study
【字体:
大
中
小
】
时间:2026年05月10日
来源:Journal of Medical Internet Research 6
编辑推荐:
徐思佳 | 刘梦梦 | 马海平 | 徐凯霆 | 李海燕 | 马莉莉 | 纪梦婷
同济大学医学院
上海,中国
**背景**
癌症临床试验对于推动治疗创新至关重要;然而,患者招募在全球范围内仍然是一个持续的挑战。了解癌症患者参与临床试验的态度和意愿对于改进招募策略至
徐思佳 | 刘梦梦 | 马海平 | 徐凯霆 | 李海燕 | 马莉莉 | 纪梦婷
同济大学医学院
上海,中国
**背景**
癌症临床试验对于推动治疗创新至关重要;然而,患者招募在全球范围内仍然是一个持续的挑战。了解癌症患者参与临床试验的态度和意愿对于改进招募策略至关重要。虽然之前的研究已经探讨了障碍和促进因素,但很少有研究整合了多种数据来源或使用新兴的分析方法(如大型语言模型(LLMs)来捕捉患者决策的多维度性质。此外,针对中国医疗环境的研究有限,在这种环境下,文化、经济和系统因素可能对参与决策产生独特影响。
**目的**
本研究旨在通过以下方式探讨中国癌症患者参与药物临床试验的态度和意愿:(1)识别影响患者决策过程的关键主题;(2)将研究者主导的定性分析结果与2个LLM(Gemini Pro 2.5和DeepSeek R1)生成的结果进行比较;(3)评估混合分析方法在定性健康研究中的互补价值。
**方法**
本研究采用多阶段定性研究方法,使用两种数据来源:与上海一家三级医院的癌症患者进行半结构化的面对面访谈(n=11)以及从两个中国在线健康社区(Zhihu和Yu-Ai-Gong-Wu)收集的公开评论。在最初的3148条评论中,经过系统筛选后有219条符合纳入标准。使用了三种平行分析方法:研究者主导的主题分析、Gemini Pro 2.5辅助分析和DeepSeek R1辅助分析。两种LLM接收了相同的结构化提示。系统地比较主题输出,以确定趋同和不同的发现。
**结果**
三种分析方法共同确定了7个核心主题:治疗选择、经济负担缓解、治疗效果的不确定性、对照组的相关性、认知不足、误解以及对医生的信任。研究者主导的分析与DeepSeek R1的分析之间存在大量主题重叠(8个共同主题,包括家庭参与决策和服务相关因素),研究者主导的分析与Gemini Pro 2.5的分析也存在重叠(3个共同主题,包括地区差异和自主决策)。方法特定的主题包括对医疗价值的认识(仅研究者了解)、临床数据不足(仅DeepSeek R1了解)以及信息资源缺乏(仅Gemini Pro 2.5了解)。这些发现突显了试验参与决策的多维度性质,涵盖了治疗期望、经济考虑、风险感知、认知因素、信任关系以及参与障碍的结构因素。
**结论**
癌症患者参与临床试验的意愿受到治疗期望、经济考虑、风险感知、认知因素和关系动态的复杂相互作用的影响。混合分析框架展现了互补的优势:人类分析提供了背景深度和文化敏感性,而LLM则提高了效率并识别了额外的主题维度。这些发现强调了以患者为中心的沟通策略、透明的试验信息和针对文化特点的招募方法的重要性。未来的研究应扩大样本多样性,并进一步验证LLM在定性健康研究中的应用。
**引言**
癌症是发达国家的主要死亡原因之一。根据GLOBOCAN 2022年的数据,中国每年新增482.5万例癌症病例和257.4万例癌症相关的死亡病例,分别占全球总数的24%和26%[1]。这不仅造成了沉重的疾病负担,还带来了巨大的社会经济成本。临床试验是推进癌症治疗、提高生存率和引入创新疗法的关键手段[2]。然而,实施临床试验面临系统性的障碍。超过80%的试验未能在目标时间内完成所需的样本招募[3,4]。高达19%的试验因招募不足而被终止[5]。成年患者的参与率极低,长期徘徊在2%到8%之间[6-8]。这些缺陷通常需要调整措施,例如延长时间框架和增加试验站点数量,以扩大参与者招募规模。然而,这些措施具有显著的经济影响[9]。患者关于是否参与试验的决定可能受到多种因素的影响,包括知识有限、对知情同意过程的担忧以及动机低下[10-12]。先前的研究广泛探讨了影响癌症患者参与药物临床试验的因素。2015年的一项重要系统评价涵盖了36项定量研究和15项定性研究,确定了影响放疗、外科手术和药物试验参与的各种个人、结构和社会因素[13]。最近的研究特别关注药物试验的细微背景。例如,2019年的一项定性综合研究发现,患者的决定受到人际因素的关键影响,如对医生的信任、家属的态度以及对家庭影响的感知[14]。然而,这些研究的一个主要局限性是它们依赖于单一的方法论方法,要么完全是定性的,要么完全是定量的。之前的定量研究考察了因素之间的关联,但往往无法捕捉患者的主观体验。相比之下,定性研究提供了关于情感和体验维度的宝贵见解,但由于样本量小且代表性不足,其发现受到限制。为了克服这些局限性,需要采用结合在线话语分析和深入访谈的混合方法,从而提高对患者观点的理解的代表性和深度。
**社会和健康研究中的一个重大挑战**
是获取既真实又具有广泛代表性的数据。尽管定性研究不追求统计上的代表性,但样本的多样性直接影响理论饱和度和概念覆盖范围。在线数据收集通过跨不同地理、年龄和专业背景的用户内容的算法筛选,能够快速构建多样化的样本池[15]。先前的研究利用来自在线健康社区(OHCs)的数据来建模患者的社会支持需求,以更好地满足他们的需求[16]。一项对28项定性研究的元综合进一步阐述了使用在线社交平台对于应对妊娠丢失个体的机会和挑战[16]。因此,本研究利用在线数据的广泛范围和真实深度来调查癌症患者参与药物临床试验的态度和意愿。
**大型语言模型(LLMs)**
大型语言模型(LLMs)已成为处理和分析文本数据的强大工具。这些人工智能(AI)系统,如GPT,在模式识别和主题提取方面表现出色,可以补充传统的定性方法[17]。然而,LLMs并非完全中立的分析工具;它们携带了来自训练数据和算法设计的偏见。此外,LLMs在辨别情感细微差别和背景深度方面存在困难[18]。人类研究者具有更全面的视角和更深的理解能力,这一点在复杂的因果推理、理论构建和知识生产中得到了人本主义的强调。因此,本研究提倡利用LLMs当前的定性文本分析能力来辅助研究人员,从而提高研究的可靠性和可重复性。
**本研究采用了两种数据收集方法**:进行一对一的半结构化访谈和使用Python(Python软件基金会)收集在线话语。在这种分析方法中,传统的定性分析与LLM的能力相结合。通过从这两种方法的角度分析患者的叙述,本研究旨在全面评估癌症患者参与试验的态度和意愿,最终为优化招募提供基于证据的策略。目标是提出有针对性的干预策略,以改善癌症患者的临床试验体验,并为促进参与者招募的顺利进行提供科学依据。
**方法概述**
本研究采用多阶段定性设计,使用两种不同的数据来源,并通过三种分析视角进行考察。研究过程分为三个阶段,以确保全面评估。第一阶段包括准备工作,特别是基于文献回顾制定访谈指南。第二阶段包括双渠道数据收集,通过一对一患者访谈和Python抓取在线话语来获取详细叙述。第三阶段专注于分析和比较综合,其中传统的人类定性编码与LLM驱动的主题分析相结合(图1)。
**图1. 多阶段研究设计流程图,展示了探索中国癌症患者参与药物临床试验态度的数据收集和分析三个阶段。**
**访谈指南开发**
最初的访谈指南是根据文献回顾制定的,并在试点访谈后进行了完善,最终版本包括四个维度:临床试验的个人经历、决策因素、社会影响以及未来参与的意愿(框1)。最终的半结构化访谈指南如下:
- 请您详细阐述您对临床试验的理解。
- 您是否曾经参加过临床试验?
- 如果您参加过临床试验:您参加了哪种类型的临床试验?
- 请描述您参与临床试验的过程,并对其进行评价。
- 您周围的人对您参与临床试验的态度是什么?
- 您愿意参加新的临床试验吗?为什么愿意或不愿意?
- 如果您没有参加过临床试验,您不参加或拒绝参加的原因是什么?
- 您的社交圈中有没有人参加过临床试验吗?您认为他们参与或拒绝的原因是什么?
**纳入和排除标准**
**访谈对象**
采用目的性抽样方法招募符合纳入标准的患者:(1)组织学或细胞学确诊为恶性实体瘤的成年人;(2)教育水平至少达到初中;(3)东部协作肿瘤组评分为0-1;(4)预期寿命至少12周。这些标准是为了确保参与者有足够的体力完成20-40分钟的访谈,并具有表达临床试验决策中复杂因素的认知能力。需要指出的是,这些标准本质上排除了体质最弱的患者和教育背景有限的患者,因此他们的观点可能在本研究中代表性不足。所有参与者都必须自愿参与研究,充分理解研究程序,并提供书面知情同意书。如果有精神疾病史、认知障碍、沟通障碍或活跃的中枢神经系统转移(如脑水肿和进行性病变),则被排除在外。在向所有参与者充分解释研究目的和程序后,获得了他们的知情同意。共有11名参与者接受了面对面访谈。
**在线数据**
纳入标准是:(1)明确讨论癌症药物临床试验的评论;(2)来自癌症患者或其护理人员的评论;(3)内容长度足够长(≥10个中文字符),可以进行有意义的分析。排除标准是:(1)重复评论;(2)不完整或难以理解的评论;(3)广告或 promotional 信息。
**数据收集**
数据收集结合了个体视角和人群层面的见解。这种双管齐下的方法通过深入的一对一访谈实现了这一点,提供详细的个人叙述,同时系统地收集了在线平台的公共评论,从而了解集体情感和自发反应。
**面对面访谈**
面对面访谈于2025年1月进行。所有访谈均由具有临床试验和肿瘤护理经验的受过培训的定性研究人员进行。每位患者只接受一次访谈,不重复访谈。访谈安排在受访者方便的时间,一对一进行,每次持续20到40分钟,允许参与者自行决定披露程度。所有访谈均在参与者同意的情况下进行了录音。
**在线数据抓取和筛选**
本研究通过网页爬虫收集在线数据,检索了2010年9月至2025年5月期间发布的评论。文本数据来自两个不同的中国在线平台:Zhihu和Yu-Ai-Gong-Wu(与癌症共舞)。选择这两个平台是有目的的,旨在通过结合广泛的公共讨论和个人故事来涵盖多种观点。Zhihu是一个以问答为基础的著名社交平台,以其来自专业人员、专家和积极参与的普通用户的高质量、深入内容而闻名。Zhihu上关于癌症相关话题的总浏览量已超过38.1亿次。Yu-Ai-Gong-Wu(意为“与癌症共舞”)是一个专门为癌症患者及其家庭设立的在线支持社区,成立于2010年。该平台促进同伴之间的支持和共享第一手治疗经历和情感历程。该论坛有超过100万条帖子,成员超过18万人。数据收集使用了自定义的Python网络爬虫进行。爬虫程序被设计用来抓取选定的平台上公开可访问的文本数据(带有时间戳的帖子和评论),通过目标关键词进行筛选,这些关键词包括“药物临床试验”和“肿瘤学药物测试”。所有数据都被匿名处理以保护用户隐私,收集过程遵守了相关法律和平台的服务条款。随后实施了一个严格的多阶段数据预处理协议,以确保数据集的质量和相关性。通过网络爬取,共识别出3148条与癌症临床试验相关的评论。在删除了39条重复评论后,保留了3109条独特的评论进行进一步筛选。在初步筛选阶段,以下评论被排除:(1)包含广告或促销信息(n=75);(2)与癌症临床试验无关(n=2475);(3)在去除表情符号和超链接后少于10个有意义的字符(n=208)。共有2758条评论被排除,351条评论被保留下来进行进一步资格评估。在第二阶段的资格评估中,两名研究人员独立审查了剩余的351条评论。如果评论与本研究主题无关(n=118),或者内容不完整或难以理解(n=14),则也会被排除。两位评审者之间的分歧通过讨论解决,必要时由第三位研究人员进行裁决。在排除了132条评论后,最终保留了219条有效的评论用于分析。
文本数据通过去除无关字符、标准化标点符号以及将表达情感的表情符号进行分词处理来规范化。所有的纳入和排除决策都被记录在一个结构化的数据集中,其中包括帖子ID、筛选结果、排除原因以及评审者的备注。在完成之后,随机检查了5%的数据以确保准确性。这种两步式的透明筛选过程确保了用于定性分析的数据集的可靠性、有效性和可重复性。
数据分析
本研究采用了一种并行分析方法,结合了研究人员主导的分析和大型语言模型(LLM)进行分析。访谈记录使用Feishu软件(北京Feishu科技有限公司)进行转录,两名研究人员独立核实了转录内容的准确性。
研究者主导的内容分析
内容分析用于分别分析访谈记录和在线评论,从而提取关键主题。两名研究人员通过反复阅读文本数据、识别有意义的陈述并分配代码来独立分析材料。在总结之后,形成了初步的主题。在分析过程中出现分歧时,通过研究小组讨论解决,直到达成共识,最终确定最终的研究结果。所有访谈记录在分析前都被匿名处理,特别是在LLM辅助分析阶段,特别关注数据隐私。
生成式AI辅助分析:Gemini Pro 2.5和DeepSeek R1
该研究需要将匿名转录文本转换为纯文本格式,以便由Gemini Pro 2.5(Google AI Studio于2025年3月发布的版本)和DeepSeek R1(2025年1月发布的版本,通过[19]访问)进行处理。根据研究目标制定了一个初始提示,并在一组20条在线评论的校准子集上进行了测试。两篇LLM使用的初始提示是:
“请分析文档中癌症患者的访谈记录/癌症患者的在线平台评论。你的任务是:(1)识别与患者参与药物临床试验的意愿和态度相关的主要主题和子主题。(2)对于每个主题,提取2个能反映主题见解的关键引文或短语,并解释它们对理解患者态度的重要性。”
在校准阶段发现了两个需要改进的问题:(1)初始提示允许使用意译摘要,这妨碍了引文的验证;(2)输出格式在不同回答之间不一致。提示被修改为要求使用原文引文,并指定了一个结构化的输出格式。一旦确定,该提示就被固定下来,并在所有后续分析中一致应用,不再进行修改。
与人类编码员不同,LLM不会逐行应用预定义的代码手册或进行迭代编码。因此,传统的评分者间可靠性指标(如Cohen κ)不适用于它们的输出。相反,通过提示构建的透明度和对AI生成主题的人工审查来确保分析的一致性和有效性[18]。
初始提示被修改为:
“请分析以下关于癌症患者参与药物临床试验态度的匿名[访谈记录/在线评论]。你的任务是:(1)识别与患者参与临床试验的意愿和态度相关的主要主题和子主题。(2)对于每个确定的主题,从源文本中提取确切的2个原文引文,最好能体现该主题,并提供每个引文的重要性的简要解释。(3)以结构化格式呈现你的发现,包括主题名称、子主题、支持引文和解释性说明。确保所有引文都完全按照它们在源文本中的样子复制。”
这些改进提高了LLM输出的一致性和可验证性。访谈记录(N=11)被汇编成一个包含参与者标识符(P01-P11)的单一匿名文档。在线评论(n=219)被组织到一个单独的文档中,带有顺序标识符(ZH01-ZH53和YAGW001-YAGW166),每条评论都有明确的边界。文档分别上传到每个LLM平台作为上下文输入,模型被给出结构化指令,通过上下文学习来识别总体主题。
LLM的输出由两名研究人员独立审查,以验证(1)引文归属的准确性(即引用的文本确实出现在源数据中),(2)主题分类的一致性和相关性,(3)不存在捏造或幻想的内容。通过第三名研究人员的讨论解决了差异。无法在源数据中验证的引文被排除在最终分析之外。
比较分析
为了确保研究结果的跨方法可靠性,进行了系统的比较分析。通过平行审查评估了所有分析方法得出的主题,解决了术语变化和解释差异的问题。创建了一个主题地图,将同义或相关的标签连接起来,形成了一个统一的主题框架(图2)。
图2. 该图展示了三种分析方法(研究者主导、Deepseek R1和Gemini Pro 2.5)在分析癌症患者对临床试验参与态度时的主题收敛和分歧。
当不同的术语指向相同的概念时,观察到了概念上的对齐。例如,研究者主导的子主题“关于疗效的担忧”,Gemini Pro 2.5的“由不确定性引起的恐惧”,以及DeepSeek R1的“疗效的不确定性”在语义上是等价的,并被合并为统一的主题“疗效不确定性”。相反,当方法捕捉到主题的不同强度或方面时,解释上的分歧被用作更深入理解的来源。关于经济动机的明显差异是:虽然人类分析识别出一般的“经济压力缓解”,但DeepSeek R1关注的是程序上的“费用减免”,而Gemini Pro 2.5强调了更加绝望的情绪,即“免费治疗是唯一出路”。研究团队重新评估了源数据,确定这些都是不同但互补的维度。因此,这些被综合为“经济负担缓解”这一综合主题。
如果主题在不同方法中体现了实质上等价的观点,则被归类为一致。一名独立评审员进行了分类,第二名研究人员验证了所有分类,研究团队内部通过共识解决了分歧。
伦理考虑
本研究得到了上海交通大学医学院仁济医院伦理委员会的批准(LY2025-140-B),并遵循了相关的伦理准则,包括《赫尔辛基宣言》和互联网研究者协会的准则[20]。对于面对面访谈,所有参与者都获得了书面知情同意。对于在线数据部分,由于研究涉及对公开可用社交媒体的非干预性分析,伦理委员会免除了个别知情同意的要求。我们确保数据收集符合平台关于公开可访问内容的服务条款。为了严格保护用户隐私,所有在线数据都经过多步处理进行了完全匿名。首先,在数据抓取阶段自动删除了用户名等结构化标识符。其次,两名研究人员手动审查文本内容,以检测和删除任何剩余的可识别个人信息,如真实姓名、具体医院名称和唯一位置信息。这确保了本手稿中呈现的任何引文都无法追溯到特定个人。每位参与者因参与访谈获得了大约30元人民币(约合4美元)的交通补偿。
访谈参与者
本研究的访谈部分包括11名癌症患者(n=7名男性和n=4名女性),平均年龄为57.73岁(标准差13.4岁;范围28-77岁)。参与者代表了多种癌症诊断类型,其中胰腺癌最为常见(n=6,54.5%),其次是胃癌(n=2,18.2%),以及其他类型的癌症(表1)。大多数参与者已婚(n=9,81.8%),其余报告了其他婚姻状况。参与者的最高教育水平是学士学位(n=4,36.4%),其余的人完成了高中教育(n=4,36.4%)或初中教育(n=3,27.3%)。本研究中的所有与年龄相关的内容完全来自访谈数据的分析(图3)。
表1. 来自中国上海一家三级医院的癌症患者的访谈参与者的人口统计和临床特征(N=11)。数据收集于2025年1月。
变量 值
性别,n (%) 7(63.6) 4(36.4)
年龄范围(岁),平均(标准差;范围) 57.73(13.4;28-77)
家庭状况,n (%) 9(81.8) 1(9.1)
疾病持续时间(月),平均(标准差;范围) 21.82(19.90;5-82)
教育水平,n (%) 中学教育 3(27.3) 高中教育 4(36.4)
癌症类型,n (%) 胰腺癌 6(54.5) 胃癌 2(18.2)
直肠癌 1(9.1)
结肠癌 1(9.1)
宫颈癌 1(9.1)
图3. 与癌症临床试验相关的数据收集和筛选流程的流程图。共从在线平台上检索到3148条评论,并进行了两阶段筛选。最终的数据集包括219条有效的评论用于分析。
来自OHCs的评论
初步数据收集从两个平台获得了3148条评论。具体来说,从知乎获得了2960条评论,从医工网获得了188条评论。经过数据清洗和筛选后,最终确定了219条相关的评论,其中知乎有53条,医工网有166条。
平行分析的主题
由研究人员主导并由LLM驱动的分析共同得出了8个总体主题(表2)。
表2. 研究者主导和大型语言模型(LLM)辅助的定性分析中的主题覆盖情况。
主题和子主题 数据来源 分析方法
研究者主导 DeepSeek R1 Gemini Pro 2.5
治疗动机 ? ?
治疗选择 ? ?
对创新技术的期望 ? ?
成本考虑 ? ?
经济负担 ? ?
传统经济观念 ? ?
风险感知 ? ?
严重副作用 ? ?
疗效不确定性 ? ?
临床数据不足 ? ?
早期临床试验风险 ? ?
对照组不确定性 ? ?
认知差异 ? ?
缺乏认知 ? ?
误解 ? ?
医学价值认可 ? ?
品牌信任效应 ? ?
医生信任 ? ?
医院信任 ? ?
制药公司信任 ? ?
决策者 ? ?
家庭参与决策 ? ?
熟人推荐 ? ?
服务流程 ? ?
高质量服务 ? ?
繁重随访负担 ? ?
资源可获取性 ? ?
信息资源缺乏 ? ?
地区差异 ? ?
aOHC:在线健康社区
主题1:治疗动机
对于某些人来说,参与临床试验是由于在治疗后期失败后,为了追求任何剩余的生存机会:
“之前的试验因为我的肝病变复发而停止了。医生说这种药物效果不好,让我停止并重新筛查。如果我无法加入这个项目,我还是需要更换其他治疗方法。”P10
“我希望被分配到治疗组,因为其他药物已经不再有效了——如果它们还有效,谁愿意当实验品呢?”ZH07
“对创新技术的期望”
一些参与者认为临床试验是获得更好治疗的机会,增加康复的机会:
“这种药物已经经过了早期的测试阶段,反馈是积极的。即使没有这次临床试验,我仍然需要定期化疗,但参与可能会给我带来更多机会。”P01
“对于某些疾病,参与新药试验是患者能采取的唯一赌博。”ZH52
主题2:成本考虑
大多数参与者表示,他们决定参加临床试验是受到经济考虑的影响,旨在减轻家庭持续的高昂治疗成本:
“如果我们作为普通消费者购买这种药物,我们负担不起。”但是通过参加临床试验,你只需要支付一次性的费用,之后就可以免费获得该药物。P08如果没有临床试验,一疗程的ADC(抗体-药物 conjugate)至少要25万,我绝对负担不起。YAGW089
传统经济观念尽管一些受访者有足够的家庭资源,但他们表示希望为下一代保留这些资源,这受到强调“代际牺牲”和“资源代际传递”的传统家庭伦理的影响。如果我不参加,我现在服用的药物每年要花费20万。我的孩子们肯定会同意的,但我还是想留点钱给孩子们。P06
主题3:风险认知关于潜在的药物不良反应,一些人表达了他们无法忍受这些反应的担忧:我知道参加这样的试验意味着药物会有副作用,而我这个年纪已经无法承受了。这些临床试验中使用的药物是国内研发的实验性药物,副作用非常严重。P05一些参加了奥拉帕利试验的病友说副作用非常严重——甚至牙齿大块脱落,比化疗的反应还糟糕。很多人在试验中途退出了……如果参与试验这么痛苦,真的有必要吗?YAGW110
治疗效果的不确定性研究结果表明,对治疗效果和安全风险的疑虑阻碍了参与者参与临床试验的积极性。拒绝使用未经批准的研究药物通常是由于对安全问题和技术成熟度的担忧:我最担心的是临床试验可能不会成功,我对它的效果没有信心。这不仅关乎药物是否有效,还关乎它是否能真正改善我的病情。P02医生建议我们参加X-396试验,但我们仍然犹豫不决。我们真的不确定它是否有效。YAGW117
临床数据不足一些参与者认为,在报名之前提供的临床数据不足以让他们做出明智的决定,特别是关于生存率、康复率和死亡率等关键结果的概率:需要公开并彻底分析这些概率。P02
早期临床试验的风险早期临床试验的风险成为一个显著的问题。由于副作用不明确,参与者对I期试验的担忧更大,而拥有更全面的安全性和有效性数据的III期试验通常被认为更可接受:在I期试验中,许多副作用仍然不清楚。YAGW089通常我会查看试验处于哪个阶段。III期试验是最好的。YAGW090III期临床试验值得考虑。YAGW091
关于对照组的不确定性试验期间发现,对随机化过程的不确定性是一个令人担忧的问题:我害怕被分配到对照组,因为有一个治疗组和一个对照组。YAGW138在新药临床试验中,不是分为治疗组和对照组吗?如果我被分到安慰剂组,可能会延误我的病情。YAGW160
主题4:认知差异对临床试验了解不足的参与者直接感到不确定和担忧:我真的不知道试验结果会怎样——毕竟,我对这些事情不太了解。P09因为我现在什么都不懂,所以对免费试验有一种本能的担忧。YAGW025
误解一些患者由于对临床试验缺乏了解而产生了误解:使用实验性药物时,风险由患者承担。如果成功了,荣誉归发明者所有,他们就能大赚一笔!这公平吗?ZH48临床试验只是利用普通人的健康进行实验。这是一种从伤害他人中获利的方式,而且还是在法律许可范围内的,没有任何责任追究。ZH32
认识到医疗价值一些参与者认识到,临床试验不仅为个人提供了治疗机会,也为医学领域带来了前瞻性价值。他们强调,实际数据的有效性对于疾病治疗的突破和医疗保健的广泛进步至关重要:这为患者提供了更多机会,对于医学领域来说,它是针对特定疾病的一种探索性进步。通过技术的积累和应用,这样的探索可能会发现更好的药物或疗法,并最终升级治疗方法。P01临床试验当然是为了患者的利益。它们需要在医院或研究中心进行,以便推广药物,让患者能更早地获得。P03
主题5:品牌信任对于某些人来说,是否参加临床试验的决定在很大程度上依赖于通过权威渠道传达的信任,包括机构的信誉和医患关系。患者经常提到对医生的信任是他们愿意参加试验的关键因素。治疗医生的声誉和推荐给了他们安心感和可信度。仅仅是吴主任这个名字,就足以让他们毫不犹豫地参与!YAGW014我的主治医生告诉我这件事,我们愿意听从医生的建议。P08
对医院的信任参与试验的医院也起到了重要作用。参与者相信,有声誉的医院只会参与严格和合法的研究,这增加了他们对试验的信心。我知道,对于一种药物,尤其是抗癌药物来说,要进入市场并在像仁济这样的医院进行临床研究,肯定不是随便哪种药物就能入选的。P03
对制药公司的信任参与者表示更愿意参加由知名制药公司赞助的试验。这些公司的品牌声誉和国际认可度被视为试验合法性和安全性的指标。默克是一家大型、国际知名的公司。其声誉和品牌认知度非常高;他们不会进行不合法的试验。YAGW034
主题6:决策者自主决策某些参与者坚称,是否参加临床试验最终是由他们自己决定的,强调家人不能替他们做出这个选择:最终,这个决定的因素是我自己。P01因为这种事情,每一个决定我都必须自己负责。P04
家庭参与的决定一些受访者认为,与家人讨论是医疗决策过程中的一个重要部分:我肯定需要和我的妻子和孩子讨论这件事。P02当然,这是我与家人商量后做出的决定。P08
熟人的推荐一些受访者表示,他们参加临床试验主要是受到熟人的强烈鼓励:我的表姐是医院里的一名医生,是她告诉我有空位可以参加的。P10
主题7:服务流程高质量的服务一部分参与者报告了在临床试验期间与医疗团队的积极体验,指出所提供的服务非常出色,程序也灵活地满足了他们的需求:主任为我安排了所有的事宜,联系了浦东的仁济医院,第二天我就直接住院了。P06这家医院会先发短信,然后打电话确认,还会通过微信通知我。我不需要自己操心这些;到了时间他们会自动联系我。P08参加这个试验真的很好,而且还节省了大量金钱。在医院里我基本上就像VIP一样,可以优先享受各种服务,免去了排队、注册、预约和等待床位等麻烦。YAGW065
频繁的随访负担参与者报告说,随访的频率给他们带来了显著的时间负担和身体疲劳,影响了他们的日常生活:只是抽血的次数太多了。他们要求我在连续几天内每天都回来。这很不方便,那段时间我感到非常疲惫。P04常规的监测尤其频繁。最初的几个月里,每周都要进行检查——各种各样的CT扫描。这花费了很多精力。P0144
主题8:资源获取困难大多数患者表示之前没有接触过临床试验,因此因为不了解而感到恐惧。一旦被诊断出疾病,他们就缺乏获取可靠信息的正式渠道:在较小的城镇,人们往往不知道这一点。一旦听说这是“实验”,就会立刻望而却步。ZH21这是一个信息缺口。恐惧来源于缺乏了解,最终导致许多机会的丧失。ZH27
由于临床试验的专业性质,这些医疗资源在某些偏远地区可能无法获得。因此,关于临床试验的专业知识主要集中在大城市,导致偏远地区的患者对此保持警惕并避免参与:在乌鲁木齐,当时没有这样的项目。P01在像上海这样的一流大城市医院,患者对此有更高的 awareness 和更深入的理解。一旦理解了,他们就能真正认识到试验的潜在好处,从而更愿意参与。ZH21
比较分析的主题图2展示了通过三种不同的分析方法(研究者分析、Gemini Pro 2.5分析和DeepSeek R1分析)识别出的重叠和独特主题的结果。三种方法都一致认为有7个核心主题,包括(1)治疗选择、(2)经济负担减轻、(3)治疗效果的不确定性、(4)关于对照组的不确定性、(5)认知不足、(6)误解和(7)医生信任。这些主题在人类分析和人工智能辅助分析中的一致性增强了它们作为患者关注点的可信度。除了这个共同的主题基础,每种分析方法还提供了独特的见解。研究者分析是唯一能够识别出“认识到医疗价值”和“熟人推荐”这两个主题的方法。Gemini Pro 2.5分析独特地识别出了“信息资源不足”这一主题。同样,“临床数据不足”也是DeepSeek R1分析独有的主题。分析还揭示了方法之间的部分重叠。“早期临床试验风险”、“自主决策”和“地区差异”这三个主题是由研究者和Gemini Pro 2.5分析共同识别出的。研究者主导的分析和DeepSeek R1共同识别出了八个主题:“对创新技术的期待”、“传统经济观念”、“严重的副作用”、“医院信任”、“制药公司信任”、“家庭参与的决定”、“高质量的服务”和“频繁的随访负担”(图2)。这种重叠表明DeepSeek R1的分析模式与人类的解读方法高度一致。这些特定方法的结果展示了混合分析方法的互补价值:人类分析捕捉到了细致的关系和基于价值的主题,而大型语言模型分析则识别出了不同的信息和证据方面的问题。
讨论癌症患者参与药物临床试验意愿的多样性本研究采用了多阶段的定性设计,全面了解了癌症患者参与临床试验的意愿和态度。患者的决定不仅受到医疗因素的影响,还受到个人病情、家庭期望、文化背景和信息获取途径的影响[21-23]。研究结果强调了患者决策的多维度性。研究者、Gemini Pro 2.5和DeepSeek R1识别出的独特主题进一步表明,没有一种分析视角能够完全捕捉到这种复杂性。因此,捕捉这种多样性需要方法论的多元化和解释的整合。虽然之前的研究主要通过访谈或调查探讨了患者的动机和担忧[24,25],但我们的发现通过展示患者如何在参与临床研究的过程中不断协商自主性、信任和感知到的益处,加深了这一理解。与在线健康社区的新兴研究结果[26,27]一致,我们的结果还揭示了非正式的、基于同伴的讨论如何反映了影响决策的情感、社会和信息维度。这些发现共同强调了需要制定沟通策略和试验设计,以尊重个体的自主性,关注患者的具体关切,并促进他们更加知情和价值观对齐的参与。通过混合分析方法提高方法论的严谨性
传统的多源文本分析方法面临主观性和情境差异性的挑战[28-30]。最近的方法学进步,如协作式数字框架[31]和在文本解释中使用大型语言模型(LLMs)[32-35],试图提高分析的严谨性和透明度。然而,整合计算分析和人工分析对于在效率和解释深度之间取得平衡仍然至关重要。
在这项研究中,将研究者主导的主题解释与基于LLM的分析相结合,有助于更全面地理解患者对临床试验的态度。通过结合半结构化访谈的结果和在线健康社区的讨论,并使用Gemini Pro 2.5和DeepSeek R1的分析工具,得出了可信且具有情境细微差别的结果。这些结果与先前的证据一致,即定性研究中的方法论严谨性不是来源于单一方法,而是通过整合互补策略来增强有效性和解释透明度[31,36,37]。
总体而言,这些发现表明,混合分析框架可以揭示患者观点的趋同和分歧维度,从而在更广阔的临床试验参与背景下更平衡地呈现患者的真实经历。
影响患者参与临床试验的关键因素
**治疗必要性**
大多数参与者只有在现有治疗失败后才会选择参加临床试验,此时他们没有其他选择。这表明患者认为临床试验是他们的唯一希望,这与先前的研究结果一致[38,39]。因此,患者的参与决策受到治疗必要性的强烈影响,以及他们认为能够获得其他途径无法获得的干预措施的信念[40]。对于一些患者来说,他们相信自己能够治愈疾病的希望帮助他们恢复生活的正常状态,并能够应对疾病的严重后果[41]。参与者经常将参加试验视为最后的手段,这突显了感知到的治疗益处在决策中的关键作用。治疗必要性的普遍性要求在沟通中要细致入微。招募材料应明确区分研究目标和治疗可能性,承认干预措施的实验性质,并避免隐含对临床益处的保证。风险-收益讨论应在同情心和透明度之间找到平衡,清楚地区分研究目的和潜在的临床益处。为了留住这些有参与意愿但易受影响的参与者,建议提供积极的情感支持、动态的同意流程和持续的个人教育。
**值得信赖的医患关系**
医患关系是患者是否愿意参与临床试验的关键决定因素。与先前的研究一致,对医生的高度信任与更高的参与意愿相关[38],而机构的怀疑态度往往会增加患者的担忧[42]。然而,Murphy等人[43]的最新定性研究表明,这种信任可能具有伦理上的双重性。虽然它有助于促进参与,但也可能导致患者出于取悦医生或维持关系的愿望而同意参与,从而影响知情同意的效果。这就需要一个更加平衡的沟通框架,既尊重情感因素,同时保持伦理完整性。从医生的角度来看,这意味着要从教育者的角色转变为合作者,承认患者的情绪,鼓励开放对话,并确保患者感到被倾听和理解[44]。这种方法不仅能够培养真正的信任,还能加强共同决策,减少不当影响的风险。同时,必须强调沟通策略应优先考虑验证患者的自主权,而不仅仅是依赖信任来增加参与人数。
**参与的经济考量**
研究发现确认,经济因素是许多患者决策过程中的重要组成部分。这与Sun等人的研究结果一致,后者将免费治疗视为一个重要的动机因素[45]。然而,当这一经济驱动因素与Kim等人的研究结果对比时(Kim等人发现社会经济弱势群体——这些群体本应是财政激励措施最敏感的群体——在美国的试验中代表性不足),就出现了矛盾[46]。简单地归因于“文化差异”是不足的。实际上,这种分歧强烈表明,经济激励是参与的重要条件,但并非充分条件。我们的发现(基于中国背景)突显了经济救济的强大吸引力。Kim等人的研究[46]则揭示了诸如低健康素养、后勤障碍和历史不信任等结构性障碍,这些障碍可能会完全抵消经济激励的效果。因此,为了使招募策略真正公平,必须超越单纯的提供经济救济,积极消除阻碍弱势患者考虑参与机会的系统性障碍。
**程序的清晰度和后勤要求**
从服务过程的角度来看,参与者参与临床试验的意愿常常受到重复检查、长时间等待和频繁抽样的程序性负担的影响。这些要求会导致身体疲劳和心理上的脱离,最终降低参与率。先前的研究试图通过优化后勤流程(如简化在线随访、改进沟通界面、实施虚拟试验工作流程、数字工具和可穿戴设备)来缓解这一问题[47,48]。这些措施通常是对现有以站点为中心的模型的逐步改进,而不是解决患者负担的根本方案。相比之下,以患者为中心的抽样和去中心化临床试验等新兴方法旨在通过将研究融入日常生活来解决这些问题的根源[49,50]。然而,数据的关键启示不仅仅是技术更先进,而是最小化对患者日常生活的干扰对于保持参与率至关重要。因此,提高参与率的努力应优先考虑减轻协议的物理和后勤负担,而不仅仅是在繁琐的框架内数字化沟通。
**风险的情感考量**
与先前的研究一致,参与者是否愿意参与受到他们对试验风险的感知的影响[23]。他们关心的问题主要集中在潜在的不良反应、试验后的护理安排以及试验的有效性上。这凸显了有效沟通的紧迫性,需要解释潜在的益处和风险,并解决患者的担忧[40]。然而,这种风险评估并不是一个固定的过程,而是受到患者临床状况变化的动态影响。例如,随着疾病的严重程度增加或其他治疗失败后,风险承受能力往往会上升,因为人们的关注点会转向潜在的疗效。相反,个人不良经历的历史可能会导致显著的风险规避[51]。这意味着一次性的事先风险披露是不够的。相反,风险沟通应被视为一个持续且适应性的过程,随着患者临床状况和情绪状态的变化而演变。主动监测患者的看法和定期跟进讨论有助于识别变化的担忧,澄清误解,并增强对研究团队的信任。将这种动态沟通模型整合到参与者管理和招募框架中,不仅提高了伦理合规性,还增强了患者的参与度和数据的可靠性,从而有助于临床试验的整体完整性和成功率。
**患者对试验设计的看法**
与先前的研究一致,临床试验的随机设计仍然是患者参与的主要障碍[52]。患者更希望治疗计划由医生制定,而不是随机分配[24]。Murphy等人[43]指出,这种抗拒往往源于患者误解医生控制分配过程。然而,Wegge-Larsen等人[5]发现,即使患者完全理解了随机化的原理,他们仍然愿意参与以获得新的干预措施。这种对比表明,随机化的障碍并不是绝对的,而是取决于具体情境。对于治疗选择有限的患者来说,获得新治疗的机会超过了随机化的不确定性。相反,当有成熟的治疗手段可用时,随机化可能被视为失去护理的机会。因此,有效沟通随机化过程需要解决患者关于护理公平性的合理关切,而不仅仅是将其视为理解不足的问题。
**决策中的能动性定位**
本研究识别了自主决策、家庭委托和共同决策的模式,揭示了临床试验参与中复杂的能动性定位。这些发现不仅反映了个人偏好,还反映了医疗决策背后的深层文化和社交背景。虽然自主决策反映了自我决定的日益增强意识,但家庭参与的普遍性突显了重视集体判断的价值观的影响。这一观察与肿瘤学护理领域的更广泛发现一致。Dijkman等人[21]和Tielemans等人[53]的系统评价证实,家庭参与治疗决策是一个广泛存在的现象,在北美、欧洲和亚洲情境中都有观察到,这挑战了“个人自主权是例外”的观点。虽然监管要求纯独立决策[54]旨在保护患者权益,但实际上与之存在显著冲突。我们的发现与先前的研究一致,表明对于弱势患者(包括老年人和来自弱势背景的患者)来说,纯粹的自主权理想往往是难以实现的,许多人将决策权交给了医疗保健专业人员[40]。家庭的角色进一步复杂化了这一情况。Kogan等人[22]的研究强烈表明,第一阶段试验中的护理人员常常被迫默默支持患者的选择,保留自己的意见以保护患者的自主感。这种“无声支持”的行为揭示了一个关键细微差别:家庭参与并不总是试图接管决策,而常常是在支持性的关系中支持和促进患者的自主性。因此,直接移植西方中心的知情同意模型不仅不合适,而且与患者及其家庭的真实体验不符。它没有认识到证据所显示的实际情况:决策单位往往是患者与家庭的双重体,而不仅仅是单独的患者。需要一种更加精细的自主性理解,这种理解超越了僵化的个人主义,拥抱了一种关系自主性的模型。这种观点保留了知情同意的伦理基础,同时承认家庭在决策中的重要作用。
**优点和局限性**
本研究通过结合中国癌症患者的访谈数据和在线健康社区文本讨论,展示了方法论的创新,从而提高了研究结果的可信度和普遍性。一致的引导策略和严格的数据匿名化协议最小化了数据收集中的偏见。此外,分析方法本身也是一个关键优势。通过使用三角验证的方法——结合传统的人工解释和两种不同的LLMs——这项研究系统地降低了单一解释偏见的风险。这些不同方法中主题的趋同增强了我们核心发现的有效性。相比之下,每种方法识别出的独特主题确保了比任何单一方法更全面和多维度的理解。
尽管有这些优点,仍需注意几个局限性。首先,访谈样本规模较小,仅来自上海的一家三级医院,这是一个拥有先进医疗基础设施的大都市地区。这种抽样方法可能会限制访谈结果在其他医院、农村地区或医疗资源不同的地区的适用性。为了部分缓解这一局限性,我们补充了来自两个不同地理位置用户的在线讨论数据,但在线样本也偏向于具有互联网访问能力和数字素养的用户。其次,访谈纳入标准系统地排除了身体条件较差或教育水平较低的患者。鉴于“认知能力不足”被确定为参与试验的障碍,这一点尤其值得注意。我们关于认知和信息障碍的发现反映了相对功能正常、受教育程度较高的患者的观点;健康素养较低或疾病更严重的患者可能面临更大的挑战。因此,关于认知因素的结论主要适用于符合纳入标准的患者,未来的研究应特别针对这些代表性不足的群体。第三,在线数据来自两个中国平台,最终的数据集包含219条评论,虽然足以进行定性分析,但只代表了一部分在线讨论的内容。这些研究结果应当在该研究范围内进行解读,而不能代表所有关于癌症患者的在线讨论。第四,这项研究的横断面特性仅反映了某一时间点的态度。随着疾病进展、治疗方案的变化或新信息的出现,患者参与临床试验的意愿可能会发生变化。纵向研究将有助于了解患者态度在整个疾病过程中的演变情况。
**对未来工作的启示**
未来的研究应关注三个重点:首先,需要开展多中心研究,涵盖社区医院和农村地区,以了解教育水平较低且医疗资源有限的患者的观点——这些患者由于不符合纳入标准而被排除在外,但他们可能面临更严重的障碍。其次,需要从方法学角度比较不同的大型语言模型(LLM)提示策略,并检验不同模型之间的可靠性,从而确立人工智能辅助定性分析的最佳实践。第三,研究结果提出的主题为干预措施开发提供了方向:需要制定决策辅助工具来解决患者的疑虑,制定沟通策略来纠正误解,并探索将家庭成员纳入招募范围的途径,这些方面都应在前瞻性试验中进行评估。
**结论**
这项多阶段定性研究采用了一种结合研究者主导的主题分析与人工智能辅助方法的混合分析框架,探讨了中国癌症患者对参与临床试验的态度。研究发现七个核心因素一致地影响了患者的参与意愿:治疗选择、经济负担的减轻、对治疗效果的不确定性、对对照组的担忧、认知能力的局限、认知误区以及对医生的信任。这些发现强调了在实际决策过程中实用性、认知因素和关系因素之间的相互作用。这三个分析方法所得到的结果的一致性增强了研究的有效性。特定于分析方法的结果(如“对医疗价值的认知”仅见于研究者主导的分析、“临床数据不足”仅见于DeepSeek R1模型、“信息资源匮乏”仅见于Gemini Pro 2.5模型)表明,将人类解释能力与人工智能的效率相结合具有互补价值。在实际应用中,招募策略应有助于弥补知识空白,重视家庭参与度,并解决不同地区在试验参与方面的差距。这里提出的混合分析框架为寻求兼具分析严谨性和解释深度的定性健康研究提供了可复制的模型。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号