预测高中生使用人工智能学习工具的意图和行为的因素:基于扩展的计划行为理论方法 张子琪、安富海

《Behavioral Sciences》:Predictors of High School Students’ Intentions and Behaviors in Using AI Learning Tools: An Extended Theory of Planned Behavior Approach Ziqi Zhang and Fuhai An

【字体: 时间:2026年05月10日 来源:Behavioral Sciences 2.5

编辑推荐:

  摘要 如今,人工智能学习工具在中学教育中已经变得十分普遍,学生被期望能够掌握如何使用它们。然而,我们对于高中生使用这些工具的真正动机仍知之甚少。本研究应用了扩展的计划行为理论(TPB)模型,探讨情感态度、工具态度、主观规范、感知行为控制以及人工智能焦虑是否能够预测学生使用这些

  摘要
如今,人工智能学习工具在中学教育中已经变得十分普遍,学生被期望能够掌握如何使用它们。然而,我们对于高中生使用这些工具的真正动机仍知之甚少。本研究应用了扩展的计划行为理论(TPB)模型,探讨情感态度、工具态度、主观规范、感知行为控制以及人工智能焦虑是否能够预测学生使用这些工具的意图及其使用行为。后者包括三个维度:寻求人工智能帮助、评估人工智能生成的回答以及应用人工智能的输出结果。研究将态度分为情感成分和工具成分,并将人工智能焦虑作为独立的情感预测因子。数据来自中国杭州三所公立高中的513名学生,通过结构方程建模进行分析。结果表明,情感态度、工具态度和主观规范都对学生的使用意图有积极影响,而人工智能焦虑则对寻求帮助、评估回答和应用输出的行为具有负面影响。这说明,对于这些学生来说,人工智能焦虑与行为参与度的相关性更为紧密,而非仅仅影响使用意图的形成。这一发现有助于阐明青少年如何使用人工智能学习工具,并为学校提供更有针对性的支持,以实现负责任的人工智能使用。

1. 引言
生成式人工智能及相关学习工具正在重塑学生获取信息、完成学术任务和接收反馈的方式。大型语言模型、智能辅导系统和人工智能驱动的学习平台可以为学生提供解释、示例、练习建议和写作反馈,从而在一定程度上支持他们的学习过程(Chiu, 2024; Crompton & Burke, 2023; Kasneci et al., 2023; Lim et al., 2023)。在中国K-12教育背景下,像Doubao、ERNIE Bot和iFlytek Spark这样的国产人工智能应用已逐渐渗透到课堂教学、课后学习和自主学习场景中,同时相关政策也持续强调人工智能素养教育以及将智能技术与教育相结合(Chai et al., 2020; Ng et al., 2021; Ng et al., 2023b; Sing et al., 2022)。然而,人工智能在学校中的日益普及也引发了担忧,比如过度依赖人工智能生成的内容、独立思考能力的减弱以及学术诚信问题(Chan & Hu, 2023; Cotton et al., 2024)。尽管人工智能的可用性增加,但并不意味着学生一定会持续、恰当地或有效地使用这些工具(Strzelecki, 2024)。因此,理解与学生使用人工智能学习工具相关的心理和社会因素成为教育研究和实践中的一个重要课题。

以往的研究为这一领域提供了有用的起点,但仍存在两个局限性。首先,大多数关于教育技术采用的研究集中在一般接受度或行为意图上,对身处严格监管环境中的高中生的关注较少(Ng et al., 2023a; Scherer et al., 2019)。与大学生相比,高中生更可能受到教师期望、家长监督和时间限制等因素的影响,他们在使用人工智能时的意图和行为可能存在差异。其次,现有研究往往将人工智能的使用视为单一结果,未充分考虑学生与人工智能互动的不同阶段(Lim et al., 2023)。实际上,学生愿意寻求人工智能帮助、批判性地评估其生成的回答以及将其应用于学习任务,这些行为具有质的不同性质,将其视为单一的统一体可能会掩盖驱动每种行为的独特心理机制(Ouyang & Jiao, 2021)。

计划行为理论(TPB)为这一问题提供了有用的视角(Scherer & Teo, 2019)。根据Ajzen(1991)的框架,行为意图由三个概念上独立的前因(对行为的态度、主观规范和感知行为控制)共同决定,进而预测行为的实际表现。TPB已被广泛应用于教育行为和技术采纳的研究中,包括人工智能学习、自我评估和学习参与等方面(Armitage & Conner, 2001; Chai et al., 2020)。然而,标准的TPB变量可能无法涵盖学生对人工智能相关工具的全部反应。Ajzen(1991)明确指出,只有满足两个条件时才能引入额外变量:首先,候选变量必须具有增量有效性,即它能解释超出态度、主观规范和感知行为控制之外的意图或行为变异;其次,其引入必须在理论上得到合理说明,即该变量能捕捉到与现有TPB结构不同的概念(Rivis et al., 2009)。在这一逻辑下,人工智能焦虑符合这两个条件。从概念上讲,它反映了学生对人工智能技术的特定情感反应,这与一般的评价态度或感知控制有所不同。实证研究表明,人工智能相关的焦虑能够预测超出传统TPB或TAM框架解释范围的技术使用行为(Budhathoki et al., 2024; Y.-M. Wang et al., 2022)。因此,在当前研究中纳入人工智能焦虑符合Ajzen(1991)关于合法TPB扩展的标准,而非临时添加的变量。研究人员曾考虑过道德规范和预期情感等因素作为扩展项(Rivis et al., 2009)。这在当前背景下是合理的,因为人工智能学习工具引发了关于错误信息、过度依赖、学术诚信甚至技术替代的担忧,这些担忧可能表现为人工智能焦虑,有助于解释学生如何使用这些工具(Grassini, 2023; Y.-Y. Wang & Wang, 2022)。

基于这一思路,本研究通过引入人工智能焦虑,并认识到使用人工智能学习工具本身是一种可分解为三个独立维度的行为(寻求帮助、评估回答和应用输出)来扩展TPB框架。这种处理方式基于两点考虑:首先,学生与人工智能的互动是连续的过程,涉及信息获取、信息判断和应用信息;其次,这一过程的不同阶段可能受不同因素影响——例如,学生可能有强烈的使用意图,但在实际学习任务中仍不愿采用其输出结果;同样,他们可能愿意寻求帮助而不仔细评估回答的质量。区分这些维度有助于更精确地理解学生使用人工智能学习工具的行为结构。为此,本研究基于513名中国高中生的数据探讨了两个研究问题:
(a) 哪些因素预测了高中生使用人工智能学习工具的意图?
(b) 哪些因素预测了学生在寻求帮助、评估回答和应用输出方面的行为?

本研究有三项主要贡献:它将人工智能焦虑作为补充的情感预测因子纳入TPB框架,并揭示其与企业核心构念不同的关联路径;它将人工智能学习工具的使用视为一个包含多个维度的行为过程,提供了学生与人工智能互动的更细致描述;它还提供了来自中国高中生这一较少被研究的群体的实证证据,有助于更全面理解中学阶段的人工智能辅助学习。

2. 文献综述
2.1 计划行为理论及其在教育技术研究中的应用
根据计划行为理论,个体是否执行某种行为的直接决定因素是行为意图和感知行为控制。意图又受到三个概念上独立因素的影响:态度(对行为的正面或负面评价)、主观规范(来自重要参考群体如教师、家长和同伴的期望)以及感知行为控制(个体对自己具备成功执行行为所需技能、资源和机会的信心)。TPB在教育技术和学习相关行为研究中显示出广泛应用性。Chai等人(2020)发现,中学生使用人工智能的意图受到态度、主观规范和感知行为控制的显著影响。Yan等人(2020b)在学生自我评估的研究中也验证了TPB的作用。Teo等人(2016)在教师技术采纳的研究中指出,态度和感知行为控制是使用技术意图的重要预测因子。这些发现表明,TPB不仅适用于一般技术采纳,也适用于教育情境中的自我调节和学习相关行为。最近,Strzelecki(2024)应用扩展的UTAUT模型研究了大学生对ChatGPT的接受情况,进一步证实了态度和社会影响在人工智能采纳决策中的重要性。

2.2 人工智能学习工具的使用行为
使用人工智能学习工具是一种行为。尽管以往研究通常将其视为单一结果,但学习过程表明它至少包含三个相互关联但可区分的阶段:首先,学生需要决定是否向人工智能工具求助(例如请求解释、示例或反馈);其次,他们需要判断人工智能生成的内容是否可信且适合他们的学习需求;最后,他们需要将人工智能提供的信息整合到实际学习活动中。如果将这些阶段合并为一个统一体,重要的行为差异可能会被掩盖,也无法分析不同预测因子对各阶段的具体影响。

本研究借鉴了Yan和Brown(2017)提出的循环自我评估过程模型以及Hattie和Timperley(2007)的反馈过程理论,将人工智能学习工具的使用视为包含三个维度:寻求帮助、评估回答和应用输出。虽然与教师或同伴的互动不同于接受反馈,但两者都涉及信息获取、批判性判断和后续使用。最近关于教育中人工智能的研究也将学习者与人工智能的互动描述为结合了信息寻求和反馈使用(Chiu et al., 2023; Ouyang & Jiao, 2021)。
- **寻求人工智能帮助(SA)**指学生主动向人工智能工具寻求学习支持,如请求解释、示例或建议。
- **评估人工智能回答(EA)**指学生对人工智能生成内容的批判性处理,包括比较、验证和有用性的判断。
- **应用人工智能输出(AA)**指学生报告的使用人工智能生成的信息来修改作业、调整策略或解决学习问题。这些维度之所以被区分,是因为学生在一个阶段可能表现积极,而在另一个阶段则更为谨慎。向人工智能提问是门槛较低的行为,而将其输出用于学术工作通常需要更大的责任和判断力(Hattie & Timperley, 2007)。因此,多维度的概念化提供了对学生使用人工智能工具内部结构的更精细描述。

2.3 人工智能学习工具使用行为的预测因子
在TPB框架内,本研究确定了四个关键预测因子:情感态度、工具态度、主观规范和感知行为控制。根据Ajzen(2002)的观点,对行为的态度可以分解为两个概念上不同的维度:情感成分反映了执行行为时的情感体验(如愉悦感、兴趣),工具成分反映了对该行为结果的认知评价(如有用性、价值)。这一区分在TPB研究中得到了广泛应用,有助于更精确地分析态度各方面对意图形成的影响。在人工智能学习工具的背景下,情感态度反映学生认为使用这些工具的体验是否愉悦和吸引人,而工具态度反映他们认为这些工具对其学习结果是否有帮助。
主观规范指学生从重要人物(如教师、家长和同伴)那里感受到的社会压力(Ajzen, 1991)。在学校环境中,这些人物通常包括教师、家长和同伴。先前研究表明,主观规范对教育中的技术采纳具有重要作用。柴等人(2020年)发现,主观规范显著预测了中国中学生的学习人工智能(AI)的意愿。Sing等人(2022年)也报告了主观规范与学生学习AI意愿之间的正向关联,准备程度和社会利益起到了调节作用。这种影响在高中生中可能尤为明显,因为他们所处的学习环境中的教师认可、同伴实践和家长期望都难以忽视。感知行为控制反映了个体对自己执行目标行为能力的信心,包括对所需技能、资源和机会的可获得性的判断。在TPB框架中,感知行为控制的独特之处在于它可以直接预测意愿和行为。相信自己具备有效使用AI学习工具所需的技术能力和资源的学生更有可能形成积极的意愿,并将这些意愿转化为行动。在AI教育的背景下,柴等人(2020年)发现感知行为控制是预测中学生学习AI意愿的一个重要因素,而Teo等人(2016年)也报告了感知行为控制是教师使用技术意愿的重要预测因素。这些发现表明,感知行为控制在不同的教育技术采纳情境中都是一个可靠的预测指标。

2.4. AI焦虑在扩展TPB框架中的潜在作用
Ajzen(1991年)指出,当额外的变量能够解释原始结构之外的变异时,TPB可以被扩展。因此,研究者考虑了道德规范和预期情感等变量(Rivis等人,2009年)。AI学习工具就是一个很好的扩展案例,因为学生对它们的反应不仅受到有用性或社会期望的影响,还受到标准TPB变量之外的担忧的影响。AI焦虑指的是个体遇到AI技术时产生的担忧、不安或紧张感(王雅雅 & 王,2022年)。这种情绪反应可能源于对技术复杂性的不熟悉、对信息准确性的担忧、对学术诚信的顾虑,或者害怕AI会取代人类能力(Kasneci等人,2023年)。当意愿和行为分开时,AI焦虑的作用可能与核心TPB变量不同。态度、主观规范和感知行为控制与学生对目标行为的评价密切相关,因此它们应该更直接地影响意愿。学生可能仍然表示他们打算使用AI,但在实际需要寻求帮助、判断答案或在学校作业中使用AI输出时却会犹豫不决(Venkatesh等人,2003年)。这一问题在中等教育中尤为突出,因为高中生可能对AI有积极的评价,但又担心在学校纪律和考试规范下不当使用AI所带来的风险。Venkatesh等人(2003年)指出,与意图形成相关的焦虑变量往往与行为障碍更为相关,最近的研究在AI情境中也证实了这一模式;例如,王雅梅等人(2022年)表明AI焦虑主要通过间接途径影响学生的学习行为,而不是直接塑造意愿,而Budhathoki等人(2024年)报告说焦虑对意愿和实际采纳行为有不同的预测模式。当前模型的一个核心问题是,AI焦虑应该是直接影响行为,还是通过意愿间接影响行为,或者同时通过这两种途径影响行为。三条理论和实证推理的支持表明应包括一个不完全被意愿吸收的直接路径。首先,关于技术使用的双过程理论区分了主要驱动意愿形成的深思熟虑的认知评价(如有用性、社会合法性、感知控制)和更自动的情感反应(根据Venkatesh等人,2003年),这些情感反应往往在行为实施时显现。作为一种相对自动且負面的情绪反应,焦虑更有可能通过这条途径起作用。其次,在UTAUT及其扩展模型中,焦虑已被反复作为使用行为的决定因素进行建模和观察(Venkatesh,2000年),并且最近针对AI的具体证据表明,即使意愿保持积极,AI焦虑也会限制采纳行为(Budhathoki等人,2024年)。第三,在这里研究的高中情境中,表达使用AI的意愿与在评分任务中实际应用AI之间存在理论上的意义,因为学生可能理性上支持使用AI,但由于对错误信息、过度依赖或学术诚信的顾虑而在执行时仍然犹豫(Venkatesh等人,2003年)。综上所述,这些考虑表明AI焦虑可以通过两条不冗余的途径影响AI学习工具的使用:一条是通过意愿的间接途径,符合标准的TPB结构;另一条是在行为实施时的直接途径,符合上述的双过程理论。因此,当前模型同时考虑了这两种途径,允许分别估计和报告每条途径。

因此,在TPB框架中包含AI焦虑作为扩展变量在实证上是合理的,并且从理论上有助于检验情感因素对AI学习工具使用的影响是否与传统的认知预测因素不同。

2.5. 本研究及假设
基于这一综述,本研究提出了一个扩展的TPB模型,其中情感态度、工具态度、主观规范、感知行为控制和AI焦虑被视为前因;意愿被建模为中介变量;AI学习工具的使用被分为三个结果:寻求AI帮助、评估AI响应和应用AI输出。根据TPB理论,情感态度、工具态度、主观规范和感知行为控制预计会对意愿产生积极影响。AI焦虑预计会对意愿和三个行为维度产生负面影响。意愿、感知行为控制和AI焦虑也预计会直接预测这三个行为维度。假设如下:
- 意愿的预测因素(RQ1):
H1a. 情感态度(AAT)正向预测使用AI学习工具的意愿。
H1b. 工具态度(IAT)正向预测使用AI学习工具的意愿。
H1c. 主观规范(SNS)正向预测使用AI学习工具的意愿。
H1d. 感知行为控制(PBC)正向预测使用AI学习工具的意愿。
H1e. AI焦虑(AIA)负向预测使用AI学习工具的意愿。
- 行为的预测因素(RQ2):
H2a. 意愿(INT)正向预测寻求AI帮助、评估AI响应和应用AI输出。
H2b. 感知行为控制(PBC)正向预测寻求AI帮助、评估AI响应和应用AI输出。
H2c. AI焦虑(AIA)负向预测寻求AI帮助、评估AI响应和应用AI输出。
因此,本研究的理论模型如下。图1展示了这些关系的概念模型。

3. 方法
3.1. 参与者和程序
参与者来自中国杭州的三所公立高中。采用分层抽样方法从各学校的10年级和11年级学生中招募样本,以确保年级分布大致平衡。研究排除了12年级的学生,因为他们的课程几乎完全致力于考试复习,几乎没有机会探索性使用AI学习工具。所有参与学校都已经将国内AI学习工具(如Doubao、ERNIE Bot和SparkDesk)引入到教学或课外学习活动中。因此,被调查的学生具有一定程度的AI支持学习经验。这种抽样策略有助于确保参与者能够有意义地回答问卷,但也意味着研究结果主要适用于已经接触过AI学习工具的学生。共发放了550份问卷。在排除不完整回答、明显模式化的回答(例如,在长项目序列中重复回答)以及内容明显不一致的回答后,保留了513份有效问卷,有效回应率为93.3%。所有保留用于分析的问卷都完整无缺失数据。表1展示了样本的描述性统计信息。在中国教育体系中,年级与年龄紧密相关,因此年级被作为人口统计变量而不是年龄。参与者年龄在15至17岁之间。数据收集在一个学期的常规教学时间内完成。在获得学校许可后,研究团队组织学生在学校的计算机室通过Wenjuanxing平台完成在线问卷。问卷在有序的学校会议中发放,平均完成时间约为15至20分钟。为了减少常见方法偏差的影响,采取了 beberapa 程序性措施,包括在问卷首页强调匿名性和保密性、将预测变量和结果测量分开在不同的页面上,以及在适当情况下改变回答方向。所有有效受访者都收到了学校提供的奖励。研究程序经过了研究者所在机构和参与学校的伦理审查流程的批准。所有参与者及其监护人都在数据收集前被告知了研究目的和程序,并获得了书面同意。

3.2. 测量
本研究中的所有构念都使用了适应高中生使用AI学习工具情境的成熟量表进行测量。所有项目都以简化的中文呈现,并在1(强烈反对)到5(强烈同意)的5点李克特量表上评分。项目开发和调整遵循了Ajzen(2002)关于TPB问卷构建的建议。为了确保跨文化适用性和内容有效性,采用了系统的调整程序。在第一阶段,两位具有教育心理学背景的双语研究者独立完成了所有项目的中文翻译。然后比较了两个版本,并通过共同讨论解决了差异,直至达成共识。在第二阶段,一位未接触过原始工具的独立翻译者将其翻译回英文。研究团队对照原始项目评估了翻译后的版本,并在必要时修改了措辞以保持语义等效性。在第三阶段,召集了一个专家小组审查调整后的项目。该小组包括三位专门研究心理测量和教育测量的学者以及三位具有AI整合教学经验的在职高中教师。小组成员评估了每个项目的语言清晰度、适合高中生的发展程度以及与预期构念的一致性。根据他们的反馈对项目进行了少量修改。最终调整后的问卷项目见补充材料(表S1)。

3.2.1. 情感态度(AAT)
情感态度量表包括四个根据Ajzen(2002)TPB问卷指南开发的项目。它衡量了学生对使用AI学习工具的情绪反应。一个示例项目是“使用AI学习工具很愉快。”Cronbach’s alpha值为0.89。单因素CFA指数为χ2/df = 3.722,CFI = 0.995,TLI = 0.986,RMSEA = 0.073,SRMR = 0.013。

3.2.2. 工具态度(IAT)
工具态度量表包括四个改编自Venkatesh等人(2003)的感知有用性量表和Chai等人(2020)的AI学习态度量表的项目。它评估了学生对使用AI学习工具的价值和结果的看法。一个示例项目是“使用AI学习工具帮助我了解自己的学习优势和劣势。”Cronbach’s alpha值为0.85。单因素CFA指数为χ2/df = 3.308,CFI = 0.995,TLI = 0.984,RMSEA = 0.067,SRMR = 0.015。

3.2.3. 主观规范(SNS)
主观规范量表包括四个根据Ajzen(2002)TPB问卷指南构建的项目。它衡量了学生对其使用AI学习工具的重要他人期望的认知。一个示例项目是“我的认为我应该使用AI学习工具来支持我的学习。”Cronbach’s alpha值为0.81。单因素CFA指数为χ2/df = 3.528,CFI = 0.992,TLI = 0.977,RMSEA = 0.070,SRMR = 0.019。

3.2.4. 感知行为控制(PBC)
感知行为控制量表包括六个改编自Yan等人(2020a)的自我评估PBC量表和Ajzen(2002)TPB问卷指南的项目。该研究评估了学生对自身能力、资源以及在使用人工智能学习工具方面控制感的判断。其中一个示例问题是:“我具备有效使用人工智能学习工具所需的知识。”Cronbach's alpha值为0.90。单因素CFA指数分别为:χ2/df = 1.714、CFI = 0.996、TLI = 0.993、RMSEA = 0.037和SRMR = 0.016。

3.2.5. 人工智能焦虑(AIA)
人工智能焦虑量表包含了从(Y.-Y. Wang & Wang, 2022)开发的人工智能焦虑量表中的学习焦虑子量表中选取的五个项目。该量表用于测量学生在学习环境中使用人工智能技术时的担忧和不安感。其中一个示例问题是:“当我需要使用人工智能工具完成学习任务时,我会感到焦虑。”Cronbach's alpha值为0.87。单因素CFA指数分别为:χ2/df = 1.936、CFI = 0.996、TLI = 0.992、RMSEA = 0.043和SRMR = 0.015。

3.2.6. 意向(INT)
意向量表包含了四个改编自(Chai等人,2020)的人工智能学习意向量表和Ajzen(2002)的TPB问卷指南的项目。该量表用于测量学生未来继续使用人工智能学习工具的意愿。其中一个示例问题是:“我计划在未来使用人工智能学习工具来辅助我的学习。”Cronbach's alpha值为0.84。单因素CFA指数分别为:χ2/df = 3.024、CFI = 0.995、TLI = 0.985、RMSEA = 0.063和SRMR = 0.016。

3.2.7. 寻求人工智能帮助(SA)
寻求人工智能帮助量表包含了四个改编自Yan(2018)的自我评估实践量表(SaPS)的项目,但将原始的自我评估情境修改为反映人工智能学习工具的使用情况。该量表用于测量学生主动寻求来自人工智能工具的学习支持的意愿。其中一个示例问题是:“当我遇到学习问题时,我会向人工智能工具寻求帮助。”Cronbach's alpha值为0.86。单因素CFA指数分别为:χ2/df = 5.468、CFI = 0.990、TLI = 0.971、RMSEA = 0.093和SRMR = 0.018。

3.2.8. 评估人工智能回应(EA)
评估人工智能回应量表包含了四个改编自Yan(2018)的SaPS中的自我反思维度的項目,并根据人工智能交互情境进行了修订。该量表用于测量学生对人工智能生成内容的批判性处理能力。其中一个示例问题是:“我会将人工智能生成的答案与自己的理解进行比较和验证。”Cronbach's alpha值为0.82。单因素CFA指数分别为:χ2/df = 1.660、CFI = 0.998、TLI = 0.994、RMSEA = 0.036和SRMR = 0.012。

3.2.9. 应用人工智能输出(AA)
应用人工智能输出量表包含了四个改编自Yan(2018)的SaPS中的自我调整维度的項目,并参考了(Hattie & Timperley, 2007)的反馈使用框架。该量表用于测量学生报告的在学习活动中使用人工智能生成信息的情况。其中一个示例问题是:“我会使用人工智能生成的建议来改进我的工作。”Cronbach's alpha值为0.85。单因素CFA指数分别为:χ2/df = 1.693、CFI = 0.998、TLI = 0.995、RMSEA = 0.037和SRMR = 0.011。

3.3. 数据分析
首先在SPSS 26.0中计算描述性统计量,以汇总样本特征以及所有研究变量的均值和标准差。由于所有有效的问卷都完整填写,因此分析数据集中没有项目级别的缺失数据。还检查了偏度和峰度,以初步判断数据是否适合进行结构方程建模。主要分析在Mplus 8.3中进行。首先进行了确认性因子分析(CFA),以评估九因子测量模型。通过标准化因子载荷、复合可靠性(CR)和提取的平均方差(AVE)来评估内部一致性和收敛效度。通过将AVE的平方根与构念间相关性进行比较(Fornell & Larcker, 1981a)来评估区分效度。在确认测量模型的适当性后,进一步检查了研究变量之间的相关性。由于所有变量都是在同一时间点通过自我报告问卷收集的,因此还将单因素CFA模型与假设的测量模型进行了比较,以评估共同方法偏差的潜在影响(Podsakoff等人,2003)。然后估计了完整的结构方程模型(SEM),以检验假设的路径。寻求人工智能帮助、评估人工智能回应和应用人工智能输出被指定为三个相关但不同的结果变量,并允许它们的残差相互相关。使用χ2/df、CFI、TLI、RMSEA和SRMR来评估模型拟合度。根据(Hu & Bentler, 1999)的标准,χ2/df < 3、CFI和TLI接近或高于0.95、RMSEA低于0.06以及SRMR低于0.08被视为良好的模型拟合度。最后,使用5000个经过偏差校正的自助样本测试了间接效应,并通过95%置信区间是否排除零来确定显著性(Hayes & Scharkow, 2013)。

4. 结果
4.1. 共同方法偏差测试
由于所有变量都是在同一时间点通过自我报告收集的,首先检查了共同方法偏差。具体而言,将所有39个项目加载到一个潜在因素上的单因素CFA模型与假设的九因子测量模型进行了比较。单因素模型的拟合度较差,χ2 = 5441.20,df = 702,p < 0.001,χ2/df = 7.75,CFI = 0.574,TLI = 0.551,RMSEA = 0.115,SRMR = 0.101;而九因子模型的拟合度良好,χ2 = 1256.85,df = 666,p < 0.001,χ2/df = 1.89,CFI = 0.947,TLI = 0.941,RMSEA = 0.042,SRMR = 0.052。两种模型之间的CFI差异为0.373,远大于传统的0.10基准(Cheung & Rensvold, 2002)。结合研究中使用的程序性补救措施,这些结果表明共同方法偏差在当前数据集中不是一个主要问题。

4.2. 描述性统计量和相关性
表2显示了所有变量的均值、标准差、相关系数以及AVE的平方根。偏度值介于-0.42到0.05之间,峰度值介于-0.63到-0.24之间,表明数据适合进行SEM分析。在前因变量中,工具性态度(IAT)的均值最高(M = 3.71,SD = 0.83),而人工智能焦虑(AIA)的均值最低(M = 2.92,SD = 0.91)。在三个行为维度中,评估人工智能回应(EA)的均值最高(M = 3.61,SD = 0.83),应用人工智能输出(AA)的均值最低(M = 3.39,SD = 0.93)。表2中的相关结果与理论预期基本一致。情感态度、工具性态度、主观规范、感知行为控制和意向之间均存在显著正相关,相关系数介于0.34到0.61之间。人工智能焦虑与所有其他变量显著负相关,相关系数介于-0.14到-0.36之间。三个行为维度之间的相关性介于0.43到0.47之间,表明它们之间存在关联但并不冗余。

4.3. 测量模型
九因子CFA模型对数据的拟合度良好,χ2 = 1256.85,p < 0.001,χ2/df = 1.89,CFI = 0.947,TLI = 0.941,RMSEA = 0.042,SRMR = 0.052,表明测量模型总体上是可以接受的。如附录A所报告的,CR值介于0.813到0.895之间,均高于推荐的0.70阈值;AVE值介于0.523到0.668之间,也高于推荐的0.50阈值(Fornell & Larcker, 1981b)。标准化因子载荷介于0.642到0.863之间,表明这些项目能够充分代表各自的构念。Cronbach's alpha系数(在测量描述中报告)介于0.81到0.90之间,进一步支持了这些量表的内部一致性。详细的项级因子载荷、SMC值以及构念级别的信度和效度指数见附录A。

4.4. SEM分析
在确认测量模型的适当性后,估计了扩展的TPB结构模型。结构模型的拟合度良好,χ2(675)= 1275.14,p < 0.001,χ2/df = 1.89,CFI = 0.996,TLI = 0.995,RMSEA = 0.042,SRMR = 0.052。研究模型的详细拟合指标见附录A。

关于研究问题1,结果显示情感态度(β = 0.182,p < 0.001)、工具性态度(β = 0.447,p < 0.001)、主观规范(β = 0.374,p < 0.001)和感知行为控制(β = 0.237,p < 0.001)均显著正向预测了意向。因此,H1a、H1b、H1c和H1d得到支持。人工智能焦虑对意向的预测不显著(β = 0.056,p = 0.123),H1e未得到支持。该模型解释了意向方差的57.3%(R2 = 0.573)。

关于研究问题2,意向显著正向预测了寻求人工智能帮助(β = 0.325,p < 0.001)、评估人工智能回应(β = 0.413,p < 0.001)和应用人工智能输出(β = 0.440,p < 0.001),支持了H2a。感知行为控制也显著正向预测了寻求人工智能帮助(β = 0.369,p < 0.001)、评估人工智能回应(β = 0.262,p < 0.001)和应用人工智能输出(β = 0.283,p < 0.001),支持了H2b。同时,人工智能焦虑显著负向预测了这三个行为维度:寻求人工智能帮助(β = ?0.112,p = 0.004)、评估人工智能回应(β = ?0.131,p < 0.001)和应用人工智能输出(β = ?0.247,p < 0.001),支持了H2c。这三个行为结果的方差解释分别为:寻求人工智能帮助为43.0%,评估人工智能回应和应用人工智能输出均为38.5%。表3展示了所有假设路径的标准化路径系数和假设检验结果。

4.5. 间接效应
为了进一步研究前因变量是否通过意向间接影响三个行为维度,使用5000个自助样本进行了偏差校正的自助估计。如表4所示,四个TPB核心预测变量——情感态度、工具性态度、主观规范和感知行为控制——均通过意向对三个行为维度产生了显著间接效应,标准化间接效应介于0.047到0.142之间。相反,人工智能焦虑对三个行为维度的间接效应均不显著,且这些效应的95%置信区间均包含零(Hayes & Scharkow, 2013)。这一结果与上述的结构路径分析一致:人工智能焦虑并未显著预测意向,其与行为维度的关联主要体现为直接路径而非间接路径。

5. 讨论
本研究采用扩展的TPB框架来考察高中生对人工智能学习工具使用的意向和行为。总体而言,研究结果强烈支持所提出的模型,并揭示了一种具有理论意义的模式。核心TPB变量与意向和行为之间存在一致的相关性,而人工智能焦虑与意向无显著关联,但对所有三个行为维度产生了显著的负面影响。这种模式表明,认知评估和感知的社会控制条件在意向形成中仍起核心作用,而特定于人工智能的情感担忧在行为实施阶段的影响更为显著。以下是主要发现的具体讨论。

5.1. 意向的预测因素
首先,情感态度、工具性态度、主观规范和感知行为控制均显著正向预测了使用人工智能学习工具的意向。这一结果完全符合TPB的核心命题以及先前关于教育技术使用和学习相关行为的研究(Armitage & Conner, 2001; Chai等人,2020; Yan等人,2020a)。值得注意的是,工具性态度是预测意向的最强因素(β = 0.447),其次是主观规范(β = 0.374)、感知行为控制(β = 0.237)和情感态度(β = 0.182)。这些效应的顺序表明,高中生使用人工智能学习工具的意愿更多地受到功利性判断和规范考虑的影响,而非使用工具的乐趣。工具性态度的凸显表明,学生主要从工具能否提高效率、澄清误解和支持学业表现的角度来评估人工智能学习工具。这一发现与更广泛的技术接受文献一致,在这些文献中,感知有用性通常比情感吸引力更能预测意向(Scherer & Teo, 2019)。在当前背景下,这种模式尤其合理,因为高中学习具有明确的目标导向,并且紧密围绕作业、考试和时间压力组织。因此,学生可能会将AI工具视为解决具体学习问题的潜在手段,而不是因为它们本身具有吸引力。主观规范也显示出相对较强的影响,突显了社会环境在塑造青少年与技术相关意图方面的重要性(Teo等人,2016年)。高中生通常处于一个教师监督严格、家长监督密切以及同龄人影响显著的环境中。在这样的条件下,重要他人是否认为使用AI是合法、有用或冒险的,不仅会影响学生感知到的社会认可度,还会影响他们将正面评价转化为实际行为的意愿。因此,这些发现进一步证实了社会期望在中学教育环境中具有特别重要的意义。感知到的行为控制能力也显著预测了学生的意图,表明当学生认为自己具备足够的知识、操作技能和机会时,他们更愿意使用AI学习工具。在AI背景下,感知到的控制能力不仅包括技术上的访问权限,还包括提出有效问题、解读反馈以及处理可能出现的不准确性或误用的信心。这有助于解释为什么感知到的行为控制能力不仅对行为有预测作用,还对意图的形成有贡献。

研究还表明,意图和感知到的行为控制能力显著预测了三个行为维度:寻求AI帮助、评估AI响应和应用AI输出。这一结果支持了TPB理论(Ajzen,2020年)的观点,即意图是行为的直接决定因素,并进一步表明学生声明的愿意使用AI的态度会转化为实际参与AI支持的学习活动。然而,这些效果在三个结果上并不均匀。意图与应用AI输出之间的关联最强(β = 0.440),其次是评估AI响应(β = 0.413)和寻求AI帮助(β = 0.325)。这种梯度表明,行为的后果越严重,它与深思熟虑的意图之间的联系就越紧密。向AI寻求帮助是一个启动迅速且易于撤销的低门槛行为;而评估AI响应则需要更多的认知投入;相比之下,应用AI输出则涉及将外部生成的内容整合到自己的学习产品或策略中,从而增加了准确性、原创性和责任感的重要性。因此,这一维度与意图的关联最为紧密。感知到的行为控制能力在寻求AI帮助方面的效果最强(β = 0.369),其次是应用AI输出(β = 0.283)和评估AI响应(β = 0.262)。这一发现表明,学生在开始使用AI时,对其能力的感觉尤为重要。与AI互动需要基本的操作技能、制定问题的信心以及实际使用工具的能力。相比之下,评估和应用AI输出不仅取决于能力,还取决于判断标准、任务要求和学术规范。这些后期阶段的系数较弱,可能反映了仅靠行为控制难以充分解释这些行为。

研究中最显著的发现是,AI焦虑并未显著预测意图(β = 0.056,p = 0.123),但它显著且负向地预测了寻求AI帮助(β = ?0.112)、评估AI响应(β = ?0.131),尤其是应用AI输出(β = ?0.247)。这种模式表明,对AI的焦虑并没有显著改变学生声明的愿意使用AI学习工具的意愿,但确实限制了他们实际使用这些工具的行为。换句话说,AI焦虑更多地作为行为实施的抑制剂,而不是意图形成的决定因素。这一结果与先前的技术采纳研究一致,这些研究表明与焦虑相关的变量往往与行为障碍的关系更为密切(Venkatesh,2000年)。这也与证据相符,即即使AI焦虑对意图的影响较弱或不显著,技术采纳模型中的扩展变量仍可能影响后续行为。本研究表明,在中学教育中,针对AI的特定情感需要单独的理论关注,而不能与传统TPB预测变量混为一谈。一种合理的解释是,在报告意图时,学生主要依赖于关于有用性、社会期望和个人能力的广泛判断。相比之下,在实际使用过程中,当学生必须决定是否信任AI生成的信息、是否依赖AI合适以及使用AI输出是否可能导致错误或学术风险时,焦虑可能会变得更加重要。在这种情况下,即使是总体上的愿意使用意愿仍然存在,情感担忧也可能抑制行动。

最强的负面关联出现在应用AI输出上。这一结果在理论上很重要,因为应用阶段是学生从咨询转向整合的阶段。与提问或评估响应相比,将AI生成的内容整合到自己的学习产品中需要更高的责任感和承诺。学生可能会因为对内容可靠性的不确定性、担心过度依赖或担心这种使用可能违反学术期望而犹豫。这一路径的相对较大的系数表明,当AI使用接近实际学术采纳时,AI焦虑的影响尤为显著。

研究结论、局限性和启示如下:

6.1. 结论
本研究通过扩展的TPB框架调查了高中生使用AI学习工具的意图和行为。结果表明,意图主要受工具态度、主观规范、感知到的行为控制能力以及情感态度的影响。反过来,意图和感知到的行为控制能力显著预测了寻求AI帮助、评估AI响应和应用AI输出。相比之下,AI焦虑并不显著影响意图,但直接抑制了所有三个行为维度,尤其是应用AI输出。总体而言,这些结果表明,高中生使用AI学习工具的行为受到认知评估、感知到的社会和行为条件以及AI特定情感障碍的共同影响。扩展的TPB模型为解释青少年参与AI支持的学习提供了一个有用的框架。

6.2. 理论和实践启示
本研究有几个理论意义。首先,它通过纳入AI焦虑扩展了TPB框架,表明与AI相关的情感并不简单地复制传统TPB变量的功能。虽然态度、主观规范和感知到的行为控制能力主要塑造意图,但AI焦虑似乎绕过意图,直接作用于行为层面。这一发现提示未来的基于TPB的AI支持学习研究应更仔细地区分反思性的认知评估和领域特定的情感抑制。其次,本研究将AI学习工具的使用视为一个包括寻求、评估和应用的多维结构。由于不同维度的预测因子效应大小不同,这些结果表明,将AI使用视为单一的整体结果可能会掩盖学习者在使用AI过程中的不同行为差异。实践意义同样明显:如果学校希望促进负责任且有效的AI辅助学习,不仅应关注工具的获取,还应通过AI素养教育和指导练习增强学生的工具理解,并在教师、家长和同学之间建立更一致的规范期望。同时,学校应明确解决学生与AI相关的担忧,特别是涉及错误信息、过度依赖和学术诚信的问题。现有发现表明,减少这些担忧不仅有助于改善态度,还能支持学生在日常学习中的实际行为参与。

6.3. 局限性和未来研究方向
首先,横断面设计不支持因果推断(Maxwell & Cole,2007年)。尽管假设的路径基于TPB理论,但数据是在单个时间点收集的,观察到的关联可能仍然反映了相互影响或遗漏的变量。纵向、面板或经验抽样设计更适合探讨态度、焦虑和感知控制的变化如何转化为后续行为变化。其次,所有结构都是通过学生自我报告来测量的,这使得数据容易受到社会期望、回答倾向和回顾性偏见的影响,同时也限制了对共同方法偏差的评估。在工具设计和施测过程中实施了几种程序性补救措施,并进行了单因子验证性因子分析作为事后的统计检查。尽管如此,单因子对比仍是一个有限的诊断工具,因为方法变异可能是多维的,不一定能负载在一个全局因子上。因此,应考虑方法效应的可能性来解释当前结果。未来的研究应采用更敏感的方法来评估共同方法偏差,例如在设计阶段包括预指定的标记变量或共同潜在因子模型,并用来自AI平台的更客观的行为指标(如查询日志、使用时长、修改痕迹或接受AI建议的频率)来补充自我报告测量。第三,该模型专注于AI学习工具使用的预测因子,但未包括下游学习成果。因此,目前尚不清楚寻求、评估和应用AI输出对学术表现、概念理解或自我调节学习的影响是否不同。将当前的行为框架与可测量的学习成果联系起来将大大增加其实际和理论价值。未来研究还可以发展特定维度的意图测量方法,并检验完全匹配的意图-行为模型是否具有更高的预测精度。最后,样本来自杭州的三所城市公立高中,这些学校已经将AI工具引入教育实践。虽然这种抽样策略提高了参与者回答的相关性,但也限定了结果的普遍性。农村地区、私立学校或AI整合支持较少的环境中的学生可能会表现出不同的模式。因此,需要进行跨区域、跨学校类型和跨文化的复制研究,以检验结果的稳健性和边界条件。在上述边界条件下,关于H2c的另一个解释性注意事项是:尽管假设在理论上是有根据的,但AI焦虑的直接效应与意图中介效应的相对大小仍是一个开放的实证问题。当前数据中观察到的模式表明,对三个行为维度的直接影响显著,而通过意图的间接效应不显著,这与第2.4节中概述的双路径推理一致。

补充材料可以在以下链接下载:https://www.mdpi.com/article/10.3390/bs16050736/s1,表S1:本研究中使用的调查问卷。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号