大学生在备考中使用大型语言模型的伦理条件:基于多维伦理量表(MES)与技术接受模型的整合分析

《Computers and Education Open》:Ethical conditions for university students’ adoption of large language models in exam preparation contexts

【字体: 时间:2026年02月23日 来源:Computers and Education Open 5.7

编辑推荐:

  本文探讨了大型语言模型(LLMs)在高等教育考试准备中的应用伦理。研究者调查了西班牙大学生的伦理观念(基于道德公平、结果论和义务论)如何影响其使用LLMs的意向(IU)及实际使用行为(USE)。研究发现,三种伦理维度均为使用意向的必要条件,其中结果论(CO)和义务论(DE)是意向的充分预测因子,而使用意向(IU)则是实际使用(USE)的必要且充分条件。该研究为理解AI教育工具的伦理接受机制提供了实证基础。

  
大型语言模型(LLMs)如ChatGPT,正以前所未有的力量改变着高等教育的格局。学生们可以利用它们总结内容、解释复杂概念,甚至生成模拟考题,以此辅助备考。然而,这股技术浪潮也裹挟着伦理的暗流:使用LLMs准备考试是否公平?是否会加剧“数字鸿沟”?是否意味着逃避了真正的学习过程,从而损害了学术诚信?这些问题悬而未决,而高校管理者、教师和学生们都迫切需要清晰的指引。
在此背景下,来自西班牙罗维拉·威尔吉利大学(Universitat Rovira i Virgili)和康普顿斯大学(Universidad Complutense de Madrid)的研究团队,Antonio Pérez-Portabella、Mario Arias-Oliva和Graciela Padilla-Castillo等人,决定深入探究大学生们的内心“伦理天平”。他们想知道:当学生们面对LLMs这个强大的“外挂”时,是哪些伦理考量在真正左右他们的决定?仅仅是觉得“有用”吗?还是关乎“公平”、“责任”或“规则”?更重要的是,这些伦理判断仅仅是“入场券”,还是能直接“助推”使用行为?
为了回答这些问题,研究人员在2025年4月至6月间,对151名西班牙社会科学领域的本科生进行了一项问卷调查。他们巧妙地将经典的多维伦理量表(MES)技术接受模型(TAM/UTAUT) 的理论框架相结合。MES测量了三种核心的伦理视角:道德公平(ME,指行为是否公平、公正)、结果论(CO,关注行为带来的后果是好是坏)和义务论(DE,强调遵守规则和履行责任) 。研究设定了两个核心目标:第一(RO1),探究这三种伦理感知是否是学生产生使用意向(IU)的“必要条件”——即,达不到某个最低门槛,意向就无从谈起;第二(RO2),分析这些伦理感知是否也是“充分条件”——即,更高的伦理评价是否能直接带来更强的使用意向和实际使用(USE)。为达成这两个互补的目标,研究采用了两种高级统计方法:必要条件分析(NCA)偏最小二乘结构方程模型(PLS-SEM)
研究结果为我们描绘了一幅细致而深刻的伦理决策图景。
4.2. 必要条件分析(研究目标1)的结果
通过NCA分析发现,所有三种伦理维度——道德公平(ME)、结果论(CO)和义务论(DE)——都是形成使用意向(IU)的必要条件。这意味着,如果学生在任何一项上的评分过低,他们几乎不可能产生使用LLMs备考的强烈意愿。具体而言,ME的必要性效应值(d= 0.338)最高,其次是CO(d= 0.274)和DE(d= 0.207),且均具有统计学显著性(p< 0.001)。同时,使用意向(IU)本身也是实际使用行为(USE)的必要条件d= 0.325, p< 0.001)。瓶颈分析进一步量化了这些“门槛”:例如,要达到中等水平(50百分位)的使用意向,学生至少需要在ME上达到23.8百分位,在DE上达到20百分位。
4.3. PLS-SEM分析(研究目标2)的结果
PLS-SEM分析则揭示了哪些因素是“充分”的驱动力。结果显示,使用意向(IU)对实际使用(USE)具有极强的预测力(β = 0.905, p< 0.001),证实了它是实际行为的充分条件。在三种伦理维度中,只有结果论(CO)和义务论(DE)对使用意向(IU)有显著的正向影响(CO: β = 0.350, p= 0.038; DE: β = 0.329, p= 0.013),即它们是使用意向的充分条件。而道德公平(ME)的影响在统计上并不显著(β = 0.108, p= 0.414)。
这一看似矛盾的结果(ME必要但不充分)恰恰是本研究最重要的发现之一。它表明,公平感(ME)是一道“伦理基线”或“许可门槛”。学生首先必须觉得使用LLMs备考大体上是公平的、正当的,才会考虑去用它。然而,一旦跨过了这道门槛,决定他们“用多用少”、“多想用”的,就不再是公平感本身,而是更多取决于工具能带来多大好处(CO) 以及是否符合他们心中的责任与规则(DE)。换句话说,学生们会想:“用这个公平吗?(ME过关了)”→ “它能帮我高效通过考试吗?(CO驱动)”→“用它来完成学业目标,算是我对学校、家庭尽到责任了吗?(DE驱动)”。研究还发现,CO和DE之间存在一定的补偿效应,即一方不足时,另一方可以补上以维持较高的使用意向,但ME不具备这种补偿性。
结论与讨论
这项发表在《Computers and Education Open》上的研究,为理解LLMs在教育场景中的伦理接受度提供了关键见解。它证实,学生的决策并非单一维度的功利计算,而是融合了多种伦理框架的复杂判断。道德公平确立了行为的可接受性,而结果论和义务论则提供了将接受性转化为实际接受和使用的动机。
其重要意义在于为教育实践提供了清晰的路线图:
  1. 1.
    政策制定需超越技术层面:高校在引入LLMs时,不能只提供工具,必须配套明确的伦理指南和数字素养培训,帮助学生建立负责任的使用观念。
  2. 2.
    强调“公平准入”的基础性:研究突显了ME作为必要条件的核心地位。因此,确保所有学生都能平等、合法地获得功能相当的LLM工具,是防止加剧教育不公、维护学术诚信生态的基石。
  3. 3.
    利用“结果”与“责任”驱动良性使用:教育者可以设计教学活动,突出LLMs在提升学习效率(CO)和支持达成学习目标(DE,作为学生对学业的责任)方面的积极作用,从而引导其向善使用。
  4. 4.
    评估方式的革新:鉴于学生倾向于使用他们认为有益的工具,单纯的禁止可能无效。教育者应转向注重过程、批判性思维和创造力的评估方式,使得LLMs从“答题捷径”转变为“思维伙伴”。
当然,研究也存在局限,如样本局限于西班牙社会科学学生、横截面数据无法反映动态变化等。未来的研究可以拓展到不同文化背景、学科领域,并引入纵向追踪或结合质性访谈,以更全面地描绘AI时代学生伦理决策的演变图谱。无论如何,这项研究已经有力地证明,在技术狂奔的时代,伦理的罗盘,始终是驾驭技术风帆不可或缺的导航仪
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号