架起古老智慧与认知参与的桥梁:基于聊天机器人的道德教育比较研究
《Frontiers in Robotics and AI》:Bridging ancient wisdom and cognitive engagement: a comparative study of chatbot-based moral instruction
【字体:
大
中
小
】
时间:2026年05月11日
来源:Frontiers in Robotics and AI 3.0
编辑推荐:
摘要
在当代学习环境中,说服学习者深入探讨复杂的道德和哲学概念仍然是一个重大挑战,尤其是在日益数字化的教育环境中。尽管对话式人工智能为互动学习提供了新的可能性,但其支持道德教育的潜力尚未得到充分探索。本研究比较了基于聊天机器人的学习条件与阅读条件以及无干预对照组的效果。通过认
摘要
在当代学习环境中,说服学习者深入探讨复杂的道德和哲学概念仍然是一个重大挑战,尤其是在日益数字化的教育环境中。尽管对话式人工智能为互动学习提供了新的可能性,但其支持道德教育的潜力尚未得到充分探索。本研究比较了基于聊天机器人的学习条件与阅读条件以及无干预对照组的效果。通过认知测试、自我报告的情绪参与度、心率变异性和脑电图(EEG)活动来评估学习者的结果。结果显示,与对照组相比,聊天机器人和阅读条件都有助于提高道德理解能力。情绪参与度在聊天机器人互动过程中得到评估,表明参与者具有强烈的情感投入。EEG测量显示,在教学条件下神经参与度有所增加,而阅读条件则表现出更高的注意力集中度。这两种干预条件都显示出比对照组更强的生理参与度。这些发现表明,对话式人工智能可以作为支持道德学习的有前景的交互工具,并有助于学习者在当代教育环境中更深入地理解抽象的道德概念。
引言
道德和哲学培训在当代课堂中仍然面临重大挑战,特别是当学生需要处理需要持续反思和解释的抽象或复杂文本时(Narváez和Lapsley,2009;Kristjánsson,2018)。教师在现代数字化学习环境中呈现这类材料时常常遇到困难,因为学生们已经习惯了交互技术和快速反馈循环(Deng和Yu,2023;Gabriella等人,2024;Alghamdi和Holland,2020;Zhang,2021;Cooper和Weaver,2003)。传统的教学方法,包括教科书阅读、讲座和解释性教学,往往难以保持学生的兴趣和认知参与度,尤其是对于熟悉多媒体和技术辅助学习环境的年轻学习者来说(Khalil和Mansour,2008)。为应对这些挑战,研究人员和教育工作者越来越多地探索虚拟现实(VR)、人工智能(AI)和对话系统等新兴技术,以开发更具吸引力和个性化的学习体验(Deng和Yu,2023)。这些技术在多个教育领域展现了显著的优势,通过多模式和交互式学习环境促进了学习者的参与度、情感连接和更深层次的理解(Gabriella等人,2024;Papamitsiou和Economides,2014;Prieto等人,2021)。然而,它们在道德教育中的应用——特别是在道德推理、价值观和哲学反思方面的教学——仍然相对较少。
印度思想史上最具影响力的哲学文本之一《薄伽梵歌》几个世纪以来一直塑造着道德和反思性思维。该文本通过对话式探讨了道德困境,尤其是责任(dharma)、个人道德和社会责任之间的紧张关系(Easwaran,2007)。通过阿朱纳和克里希纳之间的对话,文本探讨了与道德行为、正义、自我认知和道德决策相关的问题(Easwaran,2007)。由于该文本通过反思性对话和哲学探究来呈现道德推理,因此历史上一直是道德教育和哲学反思的重要来源。它探讨了道德责任、正义、自我认知和意识本质等基本问题,为道德决策和领导力提供了深刻见解(Easwaran,2007)。尽管具有哲学深度和历史重要性,但这类经典文本在正式教育环境中的使用仍然相对有限,通常仅限于文化或宗教研究之外。其中一个挑战在于文本中使用的复杂哲学语言和比喻表达,如果没有适当的教学支持,当代学习者可能难以理解。先前的研究表明,沉浸式和技术支持的故事讲述方法可以通过更吸引人和易于理解的格式来帮助弥合这一差距(Chauhan等人,2024a;Liu和Li,2023;Shegaram等人,2024;Steinhaeusser等人,2022)。
印度道德哲学强调通过反思责任(dharma)、自我意识和社会中的负责任行为来培养道德品格(Easwaran,2007)。与将道德视为一套严格的规则不同,古典哲学传统通常通过叙事对话和反思性探究来框架道德问题。在《薄伽梵歌》中,核心讨论是个人在面对复杂的社会责任和内在道德冲突时应如何道德行事(Easwaran,2007)。这样的讨论鼓励学习者反思正义、意图、责任和行为的后果。因此,这些传统与强调批判性反思、换位思考和道德推理的当代道德教育方法是一致的(Narváez和Lapsley,2009;Kristjánsson,2018)。
人机交互的进步为解决这些教育挑战开辟了新的可能性。一种有前景的方法是使用对话式代理和基于AI的聊天机器人,使哲学内容更加互动和易于理解(Alghamdi和Holland,2020;Prieto等人,2021;Zhang,2021;Chauhan等人,2025;Shegaram等人,2024)。基于自然语言处理技术的教育聊天机器人可以模拟对话、实时回答学生的问题并提供个性化反馈,从而支持互动学习过程(Deng和Yu,2023)。虽然这类系统已在科学教育、语言学习和编程教学等领域得到广泛研究,但在道德和哲学教育中的应用仍然有限。鉴于对基于文化和技术的道德推理教学方法的需求不断增加,这是一个重要的研究空白。
为了填补这一空白,本研究调查了Gitaverse Chatbot,这是一个基于AI的对话系统,旨在帮助学习者理解源自古典印度道德文本的哲学内容。与通用聊天机器人不同,Gitaverse旨在通过交互式的问答对话引导用户理解哲学思想。研究包括三种实验条件:与Gitaverse Chatbot互动的参与者、阅读传统材料的参与者以及没有接受任何处理的对照组。研究探讨了基于聊天机器人的互动是否能够提升认知学习成果、情绪参与度以及注意力处理的生理指标,包括心率变异性(HRV)和通过相对带功率(Gamma、Beta、Theta、Alpha和Delta)以及Alpha/Theta和Beta/Theta比率测量的EEG衍生的神经活动。
从教育角度来看,道德学习涉及多个维度。首先,它包括认知理解,即理解道德概念和道德推理的能力(Ormrod,2016)。其次,它包括情感参与,即与道德叙事的情感联系和对道德困境的共情(Mulcahy等人,2022;Bartels和Pecanha,2020)。第三,它包括反思性推理,即解释道德情境和评估不同行动方案的能力(Ormrod,2016)。在本研究中,这些维度通过行为学习测量(测验表现)、自我报告的情绪参与度以及来自EEG和HRV测量的认知参与度生理指标来体现(Marcantoni等人,2023;Shaffer和Ginsberg,2017;Mulcahy等人,2022)。
通过将古典哲学内容与当代AI技术和认知神经科学方法相结合,本研究提供了跨学科的考察,探讨了互动和个性化学习环境如何增强对道德和哲学材料的参与度。该研究为AI中介的道德学习这一新兴领域提供了实证证据,并为设计既技术先进又具有文化基础的教育工具提供了理论和实践见解。
本文的其余部分安排如下:背景文献部分回顾了基于聊天机器人的学习系统的现有研究;方法论部分描述了研究设计、参与者、材料和程序;结果部分展示了行为、生理和神经发现;最后,讨论部分解释了研究结果,并概述了对话式AI在道德教育中的应用意义。
背景文献
《薄伽梵歌》被视为经典文学中最具有影响力的哲学作品之一,常被用来讨论普遍伦理和道德哲学(Easwaran,2007)。该文本试图涵盖责任、道德责任和个人身份等各种哲学主题。然而,将这类经典文本整合到现代教育中面临许多挑战。首先,文本包含基于古代梵文传统和哲学推理的复杂哲学术语和概念,现代学习者可能难以理解(Easwaran,2007)。其次,传统地向受众介绍这类哲学文本的方式是被动阅读,可能不适应现代数字学习平台(Easwaran,2007)。由于现代学习者已经习惯了使用多媒体工具和交互式学习材料,传统的阅读哲学文本的方式可能与他们的学习习惯大相径庭(Chauhan等人,2024b)。因此,需要开发一种有效的学习方法,使哲学对话更加互动和吸引现代学习者。
根据教育理论,只有通过互动、反思和对话积极参与知识构建,学习才能有效。例如,建构主义学习理论强调了学习作为一个主动过程的重要性,在这个过程中,学习者不是知识的被动接受者,而是积极地参与解释、对话和反馈过程(Vygotsky和Cole,1978)。信息处理模型也强调了注意、编码和检索在学习中的重要性,这些可以在学习环境中得到提升(Atkinson和Shiffrin,1968;Sweller,2011)。在道德学习的背景下,长期以来人们认为,只有当学习者参与反思性学习环境时,道德学习才能得到有效促进,而不是被动学习(Dewey,1909)。最近的理论强调了批判性学习、反思性判断和对话在学习环境中的重要性(Brookfield,1998;Biesta,2011)。最近的理论还强调了价值系统背景下的反思性对话和批判性学习的重要性(Reffhaug和Lysgaard,2024)。
所有这些理论都表明,包含对话的学习环境在促进学习方面非常有效。随着新学习技术的发展,出现了开发包含对话的学习环境的新机会。例如,视频学习、虚拟学习环境和聊天机器人已被发现可以在学习的各个方面显著提高学习成果、理解和情感学习(Papamitsiou和Economides,2014;Gabriella等人,2024)。例如,涉及叙事学习的虚拟学习环境在促进道德学习方面非常有效,尤其是当它包含丰富的文化内容时(Chauhan等人,2024a)。同样,涉及机器人的互动学习环境可以提高学习保留率(Belpaeme等人,2018)。这些理论得到了具身认知理论的支持,这些理论强调了学习环境的重要性,不仅涉及认知学习,还涉及环境和情感(Barsalou,2008;Wilson,2002)。因此,像聊天机器人这样的对话式AI系统是一项令人兴奋的技术,可以用来开发互动学习环境。基于聊天机器人的这些互动学习环境可以提供自然对话、即时反馈和定制化的学习体验。这些都是基于建构主义和对话式学习理论的重要特征,在这些理论中,协作学习和认知学徒制是关键(Tegos等人,2015)。过去关于基于聊天机器人的学习环境的研究表明,它们可以在科学、编程和语言学习中有效提高学习者的动机、理解和知识保留(Deng和Yu,2023;Gabriella等人,2024)。此外,基于自然语言处理进展的对话界面的改进可以提供上下文反馈,从而鼓励学习者更深入地参与学习材料,即使是在材料具有认知挑战性的情况下。然而,尽管人们对开发教育聊天机器人很感兴趣,但在道德和哲学学习中的使用,尤其是在与古典哲学文献相关的方面,仍是一个较少探索的领域。
这些基于对话和协作学习的互动学习环境也可能影响学习者对哲学叙事的情感参与。情感参与是道德推理的重要方面,学习者在处理道德困境时的共情和情感反应至关重要。
基于这些理论视角,当前研究探讨了不同教学方式如何影响道德学习任务中的情感参与、认知学习成果和生理参与。本研究回答了以下研究问题:与传统的阅读任务相比,与对话式AI系统的互动如何影响学习者在道德学习任务中的情感参与?基于聊天机器人的教学方式和基于阅读的教学方式在道德理解成果方面有何不同?不同的教学方式如何影响道德学习任务中的生理参与?基于对话式AI和阅读的教学模式是否在哲学学习任务中引发了独特的神经参与度?交互式对话系统可能在学习任务中引发更高的情感参与度,因为它们模仿了与人类伙伴的对话,并允许学习者积极提问和参与主题讨论。因此,预计:
**假设1**:与Gitaverse Chatbot交互的参与者在学习任务中的情感参与度将高于阅读任务的参与者。
交互式系统也可能影响学习任务的认知结果。建构主义学习模型认为,交互系统中的对话式交流会增加概念理解,因为它鼓励学习者通过提问来主动参与主题讨论。然而,也预计传统的哲学内容将比不参与传统教学任务的对照组引发更高的道德理解。因此,预计:
**假设2**:在Gitaverse Chatbot任务和阅读任务中的参与者将比对照组拥有更高的道德理解结果。
**假设3**:在Gitaverse Chatbot任务中的参与者将比阅读任务的参与者拥有更高的道德理解结果。
最近关于教育神经科学的研究还强调了学习过程中生理指标的作用。心率变异性(HRV),特别是连续差异的均方根(RMSSD),被用作副交感神经系统活动和认知-情感参与的生理指标。在从事认知要求高的任务时,RMSSD值的降低通常与高水平的自主神经兴奋和心理努力相关,这是参与材料的标志。因此,如果学习者对材料感兴趣,他们的生理指标应该显示出比那些不感兴趣的学习者更高的认知努力。因此,我们预期:
**假设4**:与干预前相比,Gitaverse Chatbot和阅读条件下的参与者在干预后的生理指标值将更低,反映出在学习活动中的认知和情感参与度增加。
脑电图(EEG)是一种利用神经活动来测量大脑认知参与度的电生理测量方法。它测量不同频率带的振荡活动。在认知神经科学研究中,θ波活动通常与认知控制和记忆整合有关,而α波和β波活动与注意力控制和认知参与度有关(Marcantoni等人,2023年)。α波和β波的比率,即Alpha/Theta和Beta/Theta,通常与结构化学习任务中的持续注意力处理有关(Halderman,2021年)。对话式学习的性质涉及解释、提问和整合反馈,因此可能与阅读任务中的神经活动不同。所以,研究假设是:
**假设5**:教学条件下的神经参与度将通过EEG活动来推断。Gitaverse Chatbot条件下的θ波和γ波活动预计会增加,反映认知和互动参与度,而阅读条件下的Alpha/Theta和Beta/Theta活动预计会增加,反映持续的注意力处理。
除了对特定教育技术效果的实证贡献外,这项研究还从理论上探讨了对话式学习环境对认知、情感和神经过程的影响。通过结合对话式AI以及生理(HRV)和神经(EEG)指标,这项研究提供了一种多模态的方法来理解互动学习技术对复杂哲学材料参与度的影响。
为了验证这些假设,本研究将调查Gitaverse Chatbot的效果,这是一种基于经典哲学文本的文档引导的对话式学习环境。该聊天机器人将允许学习者提出与哲学材料相关的问题,从而模拟对话式学习体验。这种对话式学习环境将使学习者能够通过与聊天机器人的对话来理解复杂的哲学材料。
为了评估这些学习条件的影响,本研究将比较与Gitaverse Chatbot的互动、阅读哲学文本以及无干预对照组在认知学习结果(测验表现)、情感学习结果(自我报告的情感反应)和生理学习结果(HRV和EEG)方面的影响。这种多模态方法将使研究能够全面理解互动学习技术对复杂哲学材料参与度的影响。
据我们所知,这项研究将是首批调查基于聊天机器人的道德学习环境对行为学习结果、情感参与度、生理学习结果(HRV)和神经学习结果(EEG)影响的少数研究之一。
**方法**
研究目的是考察三种教学条件——Gitaverse Chatbot条件、阅读条件和对照组——对来自经典哲学文本的道德课程的认知和情感参与度的相对影响。如图1所示,研究比较了三种教学条件。共有60名参与者被随机分配到三种条件之一:Gitaverse Chatbot条件、阅读条件或无干预对照组(每种条件20人)。参与者不知道存在多个实验条件。参与者被告知研究考察了对教育材料的理解和反应;然而,关于不同教学模式之间差异的具体假设并未透露。研究采用双盲设计,参与实验和收集数据的实验者都不知道具体的研究假设和条件间的比较。
**图1** 研究的设计。参与者被随机分配到三种教学条件之一:Gitaverse Chatbot互动、传统阅读或无干预对照组。实验包括三个阶段:干预前(人口统计问卷和基线HRV测量)、干预(7分钟的教学暴露和连续HRV和EEG记录)和干预后(理解测验和聊天机器人组的情感参与调查)。
在Gitaverse Chatbot条件下,参与者通过输入与阅读材料相关的问题与AI聊天机器人互动。在阅读条件下,参与者以基于纸张的问答形式接触相同的材料,但没有互动对话。对照组没有接收任何教学内容,但保持与干预条件相同的时长,以保持实验时间的可比性。
收集行为和生理数据以考察参与者对干预的反应。行为数据包括通过测验回答评估的道德理解。生理数据包括心率变异性(HRV)和脑电图(EEG)指标,用以反映认知参与度。
如图1所示,实验分为三个阶段:干预前、干预和干预后。在干预前阶段,所有条件的参与者都完成了人口统计问卷并进行了基线HRV评估。在干预阶段,Gitaverse Chatbot和阅读条件的参与者分别收到了刺激材料,同时所有条件的生理活动被监测了7分钟。对照组在相同的7分钟内安静地坐着,没有接收教学材料。在此期间,所有参与者的EEG和HRV都被连续记录。参与者被要求保持坐着,不与研究人员互动或进行其他活动,以保持实验条件的一致性。在干预后阶段,参与者完成了评估知识保留的多项选择测试,聊天机器人组的参与者还完成了情感参与调查。
**表1** 展示了三种教学条件下的参与者的人口统计特征。共有60名参与者被招募并随机分配到三种实验条件之一:Gitaverse Chatbot、阅读或对照(每种条件20人)。参与者是年龄在18至30岁之间的大学生。在Gitaverse Chatbot组中,平均年龄为21.35岁(中位数=21,标准差=2.10),其中80%为男性,20%为女性。在阅读组中,平均年龄为21.05岁(中位数=21,标准差=1.63),其中85%为男性,15%为女性。在对照组中,平均年龄为21.05岁(中位数=21,标准差=2.50),其中80%为男性,20%为女性。
**表1** 参与者的特征
| 条件 | 平均值 | 中位数 | 标准差 | 性别 | 学术背景 | 补贴 |
|--------------|-----------|-----------|-----------|----------|---------|---------|
| Gitaverse Chatbot (n=20) | 21.35 | 21 | 2.10 | 男性 80% | 计算机科学 88.89% | 40 |
| | | | | | |
| Reading | 21.05 | 21 | 1.63 | 男性 85% | 电子工程 5.56% | 40 |
| | | | | | |
| Control | 21.05 | 21 | 2.50 | 女性 15% | 数据科学 5.56% | 40 |
| | | | | | |
| | | | | | |《薄伽梵歌》的原始文档在用户查询时被索引并检索出来,以生成基于上下文的响应。后端系统使用了GPTSimpleVectorIndex来索引存储在本地目录中的《薄伽梵歌》文本。该索引使聊天机器人能够根据学生的查询检索相关段落。PromptHelper实例管理模型约束和数据块大小,以支持在GPT-3.5系统中的高效交互。文档索引后,它们被存储在一个.json文件中,便于在后续交互中高效检索。当参与者提交问题时,聊天机器人会搜索索引内容,检索相关段落,并使用OpenAI的语言模型以Compact响应模式生成答案。该界面使用Gradio(Abid等人,2021年)构建,为技术和非技术用户提供了清晰直观的体验。这种架构使学习者能够通过交互式对话界面接触古老的道德哲学,并展示了对话式AI如何支持道德反思、认知参与和深度学习。通过将《薄伽梵歌》转变为一个交互式数字环境,Gitaverse Chatbot帮助弥合了古老知识与现代教育技术之间的差距,使学生能够以可访问、灵活且有意义的方式接触具有挑战性的道德观念。
**阅读小组**
阅读小组的参与者接收了与Gitaverse Chatbot小组相同的核心道德内容,但以基于相同哲学来源的静态文本形式呈现。他们收到了一份打印页,上面有七个预先制定好的问题和相应的答案选项。打印的问答表格结构与聊天机器人的材料相匹配,以便不同条件下的参与者接收到相同的哲学内容。然而,与聊天机器人条件不同,阅读小组没有互动性或适应性反馈。
**全面测验问题**
如表2所示,这七个选择题评估了参与者对《薄伽梵歌》第一章中提到的主要道德和哲学原则的熟悉程度,包括灵魂的本质、责任(达摩)、正义(阿达摩)、内心冲突和正义的行为。第一个问题考察了学习者对灵魂永恒性质的理解,这一概念在面对生活挑战时有助于减轻心理压力(Q1)。第二个问题评估了战士维护正义和正直的责任感,反映了关于社会责任的基于模式的道德推理(Q2)。第三个问题涉及个人道德困境与责任之间的紧张关系,通过促使学习者考虑个人如何解决内心冲突来鼓励认知去中心化(Q3)。第四个问题评估了对克里希那关于责任和生命无常的核心教义的理解,这涉及到危机时刻的高阶伦理决策(Q4)。第五个问题聚焦于德赫拉塔斯拉在德玛克谢特拉背景下的恐惧,强调了情境意识与道德判断中的伦理预期(Q5)。第六个问题考察了人们对为正义而战的死者的看法,强化了与道德承诺和目标相关的动机认知(Q6)。最后,第七个问题评估了什么使一场战斗成为正义的战斗,强调了基于原则的推理,即恢复和维护达摩(Q7)。这些问题旨在引发道德推理、情绪调节和对伦理原则的反思性评估。
**表2**
| 问题编号 | 选项 | 正确答案 | 理由 |
|---------|--------------|-----------------|-----------------------------|
| Q1 | 克里希那如何解释灵魂的本质? | a) 灵魂是短暂的,随身体消亡 | 学习者理解了导致减轻心理压力的脱离状态 |
| Q2 | 战士的责任是什么? | b) 不惜一切代价避免战争 | 这一概念强化了基于模式的道德推理 |
| Q3 | 克里希那建议如何处理责任与个人道德困境? | a) 将个人道德困境置于责任之上 | |
| | | b) 在责任和个人困境之间找到平衡 | |
| | | c) 无论个人困境如何都要履行战士的责任 | |
| | | d) 放弃责任以避免道德困境 | |
| Q4 | 克里希那在《薄伽梵歌》第一章中给阿周那上了什么重要一课? | a) 财富和权力的重要性 | 帮助发展高阶推理 |
| | | b) 责任和生命无常的重要性 | |
| | | c) 个人幸福的重要性 | |
| | | d) 投降和给予的重要性 | |
| Q5 | 为什么德赫拉塔斯拉在《薄伽梵歌》第一章中感到恐惧? | a) 他害怕潘达瓦军队的力量 | |
| | | b) 他担心德玛克谢特拉作为圣地会偏袒潘达瓦获胜 | |
| | | c) 他怀疑自己儿子们的作战能力 | |
| | | d) 他害怕克里希纳的力量 | |
| Q6 | 克里希那如何看待为正义而战的人? | a) 他们被遗忘 | |
| | | b) 他们受到谴责 | |
| | | c) 他们达到天界 | |
| | | d) 他们转世为低等生物 | |
| Q7 | 什么使一场战斗成为正义的战斗? | a) 参与战斗的战士人数 | 强调基于原则的推理 |
| | | b) 使用的技能和武器 | |
| | | c) 恢复和维护达摩(正义) | |
**对照组**
对照组没有接触到来自传统哲学文本的任何材料。在这种情况下,参与者仅在干预前阶段完成了生理测量和人口统计问卷。在干预阶段,参与者保持安静坐着,同时记录HRV和EEG数据,以提供基线生理比较。干预后,所有三个组(包括对照组)都回答了相同的测试题目。对照组的回答被用作未接触材料的熟悉度和表现基线,以便与其他两个组中的基于内容的干预效果进行比较。
**HRV测量和传感器细节**
本研究使用了HeartMath Institute设计的emWave Pro生物反馈设备来收集心率变异性(HRV)数据(HeartMath Institute,2016年)。该设备基于使用光电容积描记(PPG)传感器的HRV测量,这些传感器是非侵入性的,连接到参与者的耳垂或手指。传感器能够检测血液中脉搏体积的变化,从而测量心跳间隔,这对应于心跳的节奏。收集HRV数据后,R-R间隔(RR)以.txt格式导出以便进一步分析。然后使用专门的HRV分析软件对HRV数据进行分析,以测量自主神经系统。具体来说,使用了连续差异的均方根(RMSSD)作为HRV测量方法,因为它被认为是测量自主神经系统、副交感神经系统活动和认知-情绪活动的可靠方法(Shaffer和Ginsberg,2017年)。HRV的RMSSD测量已在各种教育和认知研究中用于评估与注意力、心理努力和学习任务中的情感参与相关的生理活动(Mulcahy等人,2022年;Shaffer和Ginsberg,2017年)。因此,使用emWave Pro生物反馈设备进行HRV测量是基于对道德学习干预中生理参与的非侵入性测量。
**EEG测量和神经数据处理**
神经活动使用MUSE S EEG头带(InteraXon Inc.)记录,这是一种经济实惠的可穿戴EEG headset,已经过认知神经科学研究的验证(Krigolson等人,2017年)。它有四个电极:两个位于额部位置(AF7, AF8),两个位于颞侧(TP9, TP10)。EEG活动以256 Hz的频率记录,在数据采集前使用50 Hz的陷波滤波器来减少电源线噪声。设置期间进行了实时信号检查,以验证所有通道的信号质量。在预处理过程中减少了眼睑闪烁、咬紧下巴和肌肉活动等运动伪影,并应用了常用的Butterworth滤波器(Ghassemi等人,2018年)。预处理确保保留了用于频域分析的干净神经数据。
**相对频段功率生成**
计算相对频段功率以确定参与者对所提供的干预的认知能力。因此,从Muse S文件中获取原始数据,Muse频段的原始数据范围为(0–1,682 μV),而脑信号的工作范围为(?100–100 μV)(Krigolson等人,2017年)。从这个原始文件中选择四列数据(RAW TP9, RAW AF7, RAW AF8, 和 RAW TP10),首先将其转换为(?100–100 μV)范围。应用Butterworth滤波器去除咬紧下巴和眼睑闪烁等伪影后,使用快速傅里叶变换收集不同频率成分的数据,如delta波(0.5–4 Hz)、beta波(13–30 Hz)、theta波(4–8 Hz)和gamma波(30–100 Hz)。在获得所有五个脑信号的功率幅度的绝对值后,通过以下公式计算相对功率(见公式1):
```plaintext
Relative x = ∑_4ch=1 Absolute Power(x,ch) / ∑_4ch=1 ∑_5b=1 Absolute Power(Band b,ch)
```
其中,Relative x反映了特定频段对全局神经活动的相对贡献,而不是其绝对幅度。Absolute Power(x,ch)表示在通道ch处测量的频段x(delta, theta, alpha, beta, 或 gamma)的绝对谱功率,ch = 1 … 4。分子表示所有四个EEG通道中选定频段的绝对功率之和。分母表示所有五个标准频率段和所有四个通道的总绝对谱功率之和。因此,比值给出了频段x的相对功率,按所有频段和通道的总谱功率进行了归一化,提供了一个独立于总体信号幅度的全球比例测量。
**数据分析**
测验回答、情感参与评分、可用性评分和HRV指标(RMSSD)使用传统的推断统计程序进行分析。测验表现得分是正确回答问题的比例(共七个问题)。情感参与和可用性满意度使用从1(强烈不同意)到5(强烈同意)的自我报告李克特量表项目进行测量,这与常见的心理测量实践一致(Boone和Boone,2012年)。生理参与度用连续差异的均方根(RMSSD)来量化,这是一个广泛用于预测副交感神经系统活动和情感-认知参与的时间域HRV参数(Shaffer和Ginsberg,2017年)。对于HRV分析,采用了双向重复测量方差分析(ANOVA),以干预组(阅读、聊天机器人、对照组)作为组间因素,时间(干预前、干预后)作为组内因素。检查了RMSSD值的主效应和交互效应。对于行为结果,使用单因素方差分析(ANOVA)分析了各组之间的测验分数差异,并在适当的情况下使用Tukey的诚实显著差异(HSD)进行事后比较。情感参与和可用性响应进行了描述性总结,因为这些测量仅在聊天机器人条件下收集。当观察到显著的主效应或交互效应时,使用Tukey的诚实显著差异(HSD)测试进行事后比较,以控制家族误差(Field,2024年)。所有分析的统计显著性均在p < 0.05的水平上进行评估。事先设定的统计功效水平为0.80(Cohen,2013年)。
**行为结果**
图5显示了三个条件下的参与者——Gitaverse Chatbot、阅读组和对照组——在七个项目上的平均正确得分。如图5所示,正确平均得分有显著差异,F (2, 57) = 12.25, p < 0.01, η2 = 0.31。使用Tukey事后检验发现阅读组和对照组之间存在显著差异(阅读:μ = 6.55 > 对照组:μ = 5.10 (p < 0.01)),以及Gitaverse Chatbot组和对照组之间也存在显著差异(Gitaverse Chatbot:μ = 6.60 > 对照组:μ = 5.10 (p < 0.01))。但阅读组和Gitaverse Chatbot组之间没有显著差异(阅读:μ = 6.55 ~ Gitaverse Chatbot:μ = 6.60 (p = 0.98))。总体而言,这些发现支持了假设2,表明Gitaverse聊天机器人和阅读条件都比控制条件产生了更高的道德理解分数,而聊天机器人和阅读条件之间没有显著差异,这表明学习成果相当,部分符合假设3。图5显示了不同教学条件下的平均测验表现。Gitaverse聊天机器人、阅读和对照组参与者的正确回答数量(共七题)。误差条代表标准误差。
为了探讨人口统计变量是否影响行为结果,进行了包含年龄、性别和研究领域作为协变量的方差分析(ANCOVA)模型。没有任何人口统计变量显著预测测验表现(年龄:F(1, 43) = 0.031, p = 0.861;性别:F(1, 43) = 0.001, p = 0.971;教育水平:F(2, 43) = 0.322, p = 0.727)。在控制了这些变量后,教学条件的影响仍然不显著(F(2, 43) = 2.403, p = 0.103)。没有观察到教学条件与人口统计变量之间的显著交互效应。
**与Gitaverse聊天机器人的情感互动**
分析了参与者对“在与Gitaverse聊天机器人讨论《薄伽梵歌》时,您是否注意到自己的情绪或生理状态有任何变化?”这一问题的回答(见图6a)。图6a显示了从“极大变化”到“没有变化”的李克特量表值。如图6a所示,一名参与者感到“极大变化”,五名参与者感到“很多变化”,八名参与者感到“一些变化”,仅有一名参与者感到“没有变化”。而图6b显示了针对“如果您确实感受到了情绪或生理状态的变化,请描述您所经历的任何感受或感觉”的问题的回答中得到的主要领域。主要领域包括:放松和平静、认知和情感参与、伦理与道德反思、表达困难、中立、关系以及视角转变(见图6b)。综合来看,这些回答表明在聊天机器人互动过程中存在有意义的情感和反思性参与,支持了假设1,该假设认为与Gitaverse聊天机器人互动的参与者会因为聊天机器人环境的对话性和响应性而表现出更强的与学习材料的情感参与。
**心率变异性(HRV)数据**
组别(Gitaverse聊天机器人、阅读和对照组)对RMSSD的主要影响显著,F(2, 57) = 3.96, p < 0.05, η2 = 0.12(见表3)。对照组的RMSSD值(μ = 103.83)高于Gitaverse组(μ = 87.41)和阅读组(μ = 88.37)(见图7a)。时间的影响也显著,F(2, 57) = 32.87, p < 0.001, η2 = 0.48(见图7b)。干预前测量(μ = 103.64)的RMSSD值高于干预后测量(μ = 82.76)。条件(Gitaverse聊天机器人、阅读和对照组)与时间之间的交互作用也显著,F(2, 57) = 8.26, p < 0.001, η2 = 0.22(见图7c)。如图7c所示,在干预前测量时,Gitaverse聊天机器人组(μ = 103.74)、阅读组(μ = 103.35)和对照组(μ = 103.83)的RMSSD值相似。然而,在干预后测量时,对照组的RMSSD值(μ = 103.83)高于阅读组(μ = 73.38,p < 0.05)和Gitaverse聊天机器人组(μ = 71.07,p < 0.05)。总体而言,这些发现支持了假设4,表明在Gitaverse聊天机器人组和阅读条件下的参与者在干预后的RMSSD值低于对照组,反映了学习活动期间认知和情感参与的增加。
**描述性统计和重复测量方差分析(ANOVA)结果**
表3报告了干预前后每种教学条件下的HRV(RMSSD)的平均值及其标准误差,以及时间、组别和时间与教学条件之间的交互作用的主要效应。
**神经数据**
条件(Gitaverse聊天机器人、阅读和对照组)对Alpha/Theta比率的主要影响显著,F(2, 57) = 30.30, p < 0.001, η2 = 0.52(见图8a;表4)。事后测试表明,阅读组的Alpha/Theta比率(μ = 1.59)高于Gitaverse聊天机器人组(μ = 0.93)和对照组(μ = 1.31)(见图8a)。条件(Gitaverse聊天机器人、阅读和对照组)与时间之间的交互作用也显著,F(2, 57) = 29.65, p < 0.001, η2 = 0.51(见图8b)。如图8b所示,在干预前测量时,Gitaverse聊天机器人组(μ = 1.30)、阅读组(μ = 1.31)和对照组的Alpha/Theta比率相似。然而,在干预后测量时,阅读组的Alpha/Theta比率(μ = 1.87)高于Gitaverse聊天机器人组(μ = 0.55)和对照组(μ = 1.31)。时间的影响不显著,F(1, 57) = 0.90, p = 0.35, η2 = 0.02。总体而言,这些发现与假设5一致,表明不同学习方式在神经参与度上存在差异,阅读条件显示出在学习任务中对持续注意力的更强关联。
**脑电图(EEG)指标**
条件(Gitaverse聊天机器人、阅读和对照组)对Alpha/Theta比率的主要影响显著,F(2, 57) = 30.30, p < 0.001, η2 = 0.52(见表4)。事后测试表明,阅读组的Alpha/Theta比率(μ = 1.54)高于Gitaverse聊天机器人组(μ = 0.93)和对照组(μ = 1.19)(见图9a)。条件(Gitaverse聊天机器人、阅读和对照组)与时间之间的交互作用也显著,F(2, 57) = 15.52, p < 0.001, η2 = 0.35(见图9b)。如图9b所示,在干预前测量时,Gitaverse聊天机器人组(μ = 1.26)、阅读组(μ = 1.26)和对照组的Alpha/Theta比率相似。然而,在干预后测量时,阅读组的Alpha/Theta比率(μ = 1.83)高于Gitaverse聊天机器人组(μ = 0.60)和对照组(μ = 1.19)。时间的影响不显著,F(1, 57) = 1.03, p = 0.73, η2 = 0.02。
**相对delta和relative theta**
条件(Gitaverse聊天机器人、阅读和对照组)对相对delta值的主要影响显著,F(2, 57) = 5.55, p < 0.001, η2 = 0.16(见表4)。事后测试表明,阅读组的相对delta值(μ = 0.23)高于Gitaverse聊天机器人组(μ = 0.21)和对照组(μ = 0.21)(见图10a)。条件(Gitaverse聊天机器人、阅读和对照组)与时间之间的交互作用也显著,F(2, 57) = 5.80, p < 0.001, η2 = 0.17(见图10b)。如图10b所示,在干预前测量时,Gitaverse聊天机器人组(μ = 0.26)、阅读组(μ = 0.22)和对照组的相对delta值相似。然而,在干预后测量时,阅读组的相对delta值(μ = 0.25)高于Gitaverse聊天机器人组(μ = 0.20)和对照组(μ = 0.21)。时间的影响不显著,F(1, 57) = 1.03, p = 0.32, η2 = 0.01。
**相对alpha**
条件(Gitaverse聊天机器人、阅读和对照组)对Relative Alpha值的主要影响显著,F(2, 57) = 46.73, p < 0.001, η2 = 0.62(见表4)。事后测试表明,阅读组的Relative Alpha值(μ = 0.23)高于Gitaverse聊天机器人组(μ = 0.17)和对照组(μ = 0.20)(见图12a)。条件(Gitaverse聊天机器人、阅读和对照组)与时间之间的交互作用也显著,F(2, 57) = 48.25, p < 0.001, η2 = 0.63(见图12b)。如图12b所示,在干预前测量时,Gitaverse聊天机器人组(μ = 0.21)、阅读组(μ = 0.21)和对照组的Relative Alpha值相似。然而,在干预后测量时,阅读组的Relative Alpha值(μ = 0.25)高于Gitaverse聊天机器人组(μ = 0.20)和对照组(μ = 0.20)。时间的影响不显著,F(1, 57) = 2.88, p > 0.05, η2 = 0.04。由于假设5中并未明确提及相对阿尔法活动(relative alpha activity),这些发现应被视为与阅读条件下更强的注意力参与度一致的补充证据,而非对假设的直接检验。图12显示了不同教学条件下相对阿尔法功率的变化。(a) 教学条件对相对阿尔法活动的主效应。(b) 教学条件与时间之间的交互效应。
#### 相对贝塔(Relative Beta)
各种教学条件(Gitaverse Chatbot、阅读和对照组)对相对贝塔值的主效应显著,F(2, 57) = 12.74, p < 0.001, η2 = 0.31(见表4)。事后检验表明,阅读条件下的相对贝塔值(μ = 0.22)高于Gitaverse Chatbot条件(μ = 0.17)和对照组(μ = 0.21)(见图13a)。时间的影响也显著,F(1, 57) = 7.08, p < 0.001, η2 = 0.11(见图13b)。测量前后的相对贝塔值也有所不同,测量前的值(μ = 0.21)高于测量后的值(μ = 0.19)。教学条件(Gitaverse Chatbot、阅读和对照组)与时间之间的交互作用也显著,F(2, 57) = 22.88, p < 0.001, η2 = 0.44(见图13c)。如图13c所示,在测量前,Gitaverse Chatbot(μ = 0.21)、阅读(μ = 0.21)和对照组(μ = 0.21)之间的相对贝塔值相似;但在测量后,阅读组的相对贝塔值(μ = 0.23)高于Gitaverse Chatbot(μ = 0.13)和对照组(μ = 0.21)。由于假设5特别关注的是贝塔/西塔比率(Beta/Theta ratio)而不仅仅是相对贝塔功率,因此这些发现应被解释为与阅读条件下更强的注意力处理一致的补充神经证据。
#### 相对伽马(Relative Gamma)
各种教学条件(Gitaverse Chatbot、阅读和对照组)对相对伽马值的主效应显著,F(2, 57) = 10.06, p < 0.001, η2 = 0.26(见表4)。事后检验表明,Gitaverse Chatbot条件下的相对伽马值(μ = 0.24)高于阅读条件(μ = 0.18)和对照组(μ = 0.22)(见图14a)。教学条件与时间之间的交互作用也显著,F(2, 57) = 9.35, p < 0.001, η2 = 0.24(见图14b)。如图14b所示,在测量前,Gitaverse Chatbot(μ = 0.21)、阅读(μ = 0.21)和对照组(μ = 0.22)之间的相对伽马值相似;但在测量后,Gitaverse Chatbot条件下的相对伽马值(μ = 0.27)高于阅读组(μ = 0.15)和对照组(μ = 0.22)。时间的影响不显著,F(1, 57) = 0.00, p > 0.05, η2 = 0.01。这一模式支持了假设5中关于Chatbot相关伽马成分的论点。因此,假设5在总体上得到了部分验证:Chatbot条件下的θ和γ活动更强,而阅读条件下的α/θ和β/θ比率更高。
#### 讨论
本研究探讨了对话型人工智能是否能够支持从古典哲学文本中进行道德学习。具体来说,研究比较了三种教学方式:与Gitaverse Chatbot的互动、传统阅读以及被动对照组,以考察认知学习成果、情感参与度、生理反应和神经活动的差异。总体而言,结果表明,基于Chatbot和阅读的教学方式显著提高了参与者对道德概念的理解程度,优于被动学习方式。这些发现提供了实证证据,表明无论是通过对话互动还是传统阅读,结构化的哲学内容暴露都可以支持在数字化学习环境中对伦理概念的有意义参与。同时,两种教学模式在生理和神经参与方面表现出不同的模式,表明不同的学习形式可能在道德学习过程中激活不同的认知过程。
行为结果表明,接触结构化的道德内容显著提升了参与者对哲学概念的理解和记忆。Gitaverse Chatbot组(M = 6.60)和阅读组(M = 6.55)的测验分数均显著高于对照组(M = 5.10)。这些发现支持了认知学习理论,即积极参与教育材料能够促进信息的深度编码和检索(Ormrod, 2016)。在本研究中,两种教学方式都要求参与者处理道德概念、思考伦理困境,并整合《薄伽梵歌》中呈现的哲学思想。因此,这些发现支持了假设2,表明无论采用何种形式,接触结构化的哲学内容都能增强学习者对道德概念的理解。
有趣的是,Chatbot组的理解分数略高于阅读组,尽管这种差异在统计上不显著。这一结果部分支持了假设3,表明对话式学习环境可能对概念理解有轻微的好处,尽管这些优势可能取决于任务的性质和学习材料的复杂性。先前关于教育Chatbot的研究表明,对话式界面可以通过允许学习者提问、获得即时反馈和参与迭代推理过程来促进概念的清晰化(Tegos等人,2015;Deng和Yu,2023;Gabriella等人,2024)。这些发现也与建构主义学习理论一致,该理论认为知识是通过互动、反思和反馈构建的(Vygotsky和Cole,1978)。在道德教育的背景下,这样的对话式互动可能比静态阅读方式更能帮助学习者积极探讨伦理难题。
与Gitaverse Chatbot互动的参与者报告了一系列情感和反思体验,包括平静的反思、伦理思考以及在对话过程中的视角转变。这些发现支持了假设1,表明对话式AI系统可以促进对哲学叙事的情感参与,这是道德推理和伦理反思的重要组成部分。
情感计算和自适应学习系统的研究表明,能够动态响应用户输入的交互系统可以创造出具有社交响应性和认知吸引力的学习环境。对话式代理通过模拟对话,可能促进更深层次的情感参与,这种教学形式历史上一直与哲学探究相关联。经典的哲学传统(包括苏格拉底式对话和印度哲学文本中的对话式推理)常常依赖对话结构来促进伦理反思。通过在数字环境中重现这种对话式互动,Gitaverse Chatbot提供了一种技术中介的哲学对话形式,有助于学习者更深入地探讨伦理问题。
虽然在本研究中仅测量了chatbot条件下的情感参与,但结果表明,在对话式学习过程中存在有意义的情感参与。未来的研究应直接比较不同教学模式下的情感反应,以更好地理解不同学习环境如何影响对伦理材料的情感参与。
生理数据提供了关于学习者在学习任务中的参与程度的额外见解。HRV分析显示,chatbot组和阅读组在认知任务中的RMSSD值低于对照组。认知任务中的较低RMSSD值与更高的自主神经激活和更大的注意力参与度相关(Shaffer和Ginsberg,2017;Mulcahy等人,2022)。这些发现支持了假设4,表明两种教学方式都需要积极的认知努力,反映了在处理哲学材料时更高的生理参与度。
这些生理发现补充了行为结果,表明积极处理道德内容需要持续的认知努力。重要的是,chatbot组和阅读组之间的相似性表明,无论采用何种传递方式,与哲学材料本身的互动都能激活与伦理推理相关的认知和情感过程。
神经数据揭示了特定于学习模式的认知处理模式。阅读组显示了更高的α/θ和β/θ比率,以及增加的相对阿尔法和贝塔活动。这些神经模式通常与阅读任务中的持续注意力处理和结构化认知努力相关(Marcantoni等人,2023)。这些结果部分支持了假设5,表明传统阅读在学习者处理复杂文本材料时促进了持续的注意力聚焦和结构化的认知处理。
相比之下,Gitaverse Chatbot条件表现出更高的相对θ和γ活动。θ振荡通常与认知控制、记忆整合和反思性处理相关,而γ活动则与整合性推理和高阶认知处理相关(Marcantoni等人,2023)。因此,在chatbot互动中观察到的θ和γ活动的增加表明,对话式学习环境可能促进与反思性对话和迭代解释相关的整合性推理过程。
总体而言,这些神经模式表明两种教学方式激活了不同的认知路径。阅读似乎促进了持续的注意力处理,而对话式AI互动可能促进了更加整合和互动的认知参与。这些发现与具身认知和交互认知理论一致,这些理论认为学习是通过学习者、环境和认知系统之间的动态互动而产生的(Barsalou,2008;Wilson,2002)。
本研究的结果对技术增强型道德教育的设计有几个启示意义。首先,结果表明,当以结构化和易于理解的格式呈现时,古典哲学文本可以有效地整合到数字学习环境中。基于阅读和Chatbot的教学都提高了对道德概念的理解,表明接触精心构建的伦理内容可以支持有意义的学习成果。其次,对话式AI系统可能为学习者提供与复杂哲学思想互动的独特机会。通过模拟对话式互动,Chatbot可以将传统文本转化为鼓励反思和探究的互动学习体验,这对于哲学教育尤为重要,因为在哲学教育中,对话和解释在理解伦理原则中扮演核心角色。第三,这些发现尤其在工程和技术教育的背景下特别相关。现代工程课程越来越强调伦理推理、负责任的创新以及人工智能和新兴技术对社会影响的认识。在这种背景下,像Gitaverse Chatbot这样的对话式AI系统可以成为鼓励技术导向学习者进行伦理反思的有用教学工具。通过将哲学推理与技术中介的学习环境相结合,这些系统可以帮助工程学生探讨责任、公平性和社会影响等当代技术实践中的核心问题。
最后,这项研究展示了将教育技术与生理和神经测量方法结合的潜力,以更深入地了解学习过程。尽管目前的发现很有前景,但仍需考虑几个局限性。首先,参与者样本主要为18-30岁的大学本科生,其中男性占多数,且主要集中在工程和技术专业。虽然这个群体为研究技术导向学习者中的AI中介道德学习提供了相关背景,但结果可能无法完全推广到其他学术或人口统计群体。未来的研究应包括更多样化的参与者群体,例如来自人文学科、社会科学和跨学科项目的学生,以确定在不同教育背景下是否会出现类似的参与模式。其次,仅在chatbot条件下测量了情感参与。未来的研究应包括多种教学条件下的可比较情感测量,以便直接比较对话式和非互动学习模式之间的情感参与度。第三,本研究仅关注了短期理解和参与结果。道德学习通常涉及长期的反思和价值观形成。因此,未来的研究应探讨对话式AI对伦理推理、道德决策和价值观内化的长期影响。最后,未来的研究可以探索将对话式AI与虚拟现实或自适应叙事环境等沉浸式技术相结合的混合教学设计,这样的方法可以通过整合对话、叙事沉浸和体验式学习来进一步增强对哲学内容的参与度。
总之,这项研究表明对话式AI作为促进对复杂道德和哲学思想理解的工具具有潜力。基于Chatbot和阅读的教学方式都显著提高了学习者对道德概念的理解,而两种教学模式引发了不同的生理和神经参与模式,表明对话式AI和传统阅读在道德学习过程中激活了不同的认知过程。重要的是,这些结果突出了对话式AI在技术导向的教育环境中支持伦理反思的潜在作用。随着工程和计算领域越来越多地面对与负责任创新、人工智能治理和社会影响相关的问题,促进伦理推理的教育工具可能变得越来越重要。“Gitaverse Chatbot”为代表了一种有前景的方法,能够将古典哲学知识与现代教育技术相结合。通过将传统的哲学文本转化为基于对话的学习体验,对话式人工智能系统可以帮助学习者更深入地理解伦理概念并进行反思性思考。更广泛地说,将植根于文化背景的哲学传统与新兴的人工智能技术相结合,可能为认知科学、教育和以人为中心的人工智能交叉领域的跨学科研究开辟新的方向。
**意义声明:**
伦理教育,尤其是基于古典文本的教育,往往难以吸引那些生活在数字化和互动式学习环境中的当代学习者。传统的学习方式(如被动阅读)可能无法激发他们深入理解和内化抽象道德观念所需的认知和情感投入。本研究旨在回应教育领域日益增长的需求:如何以符合当代学习者特点的方式有效传授哲学思想。我们研究了基于传统哲学文本训练的交互式聊天bot是否比单纯阅读或不采取任何干预措施更能提高学习者的认知和情感参与度。鉴于在伦理教学过程中遇到的实际困难以及传统学习媒介中注意力逐渐下降的趋势,我们的研究将人工智能支持的对话与认知科学方法相结合——利用测验分数、心率变异性(HRV)和脑电波(EEG)反应来评估学习效果和参与程度。研究结果表明,与聊天bot交流的学生不仅在理解任务上表现更好,还表现出更强烈的生理和神经层面的参与度。这些结果表明,对话式人工智能可以成为连接永恒的哲学智慧与现代认知学习需求的有效桥梁。通过将这一干预措施植根于古代文献和现代技术之中,本研究为数字时代的道德教育提供了一种既具有实践性又基于理论的方法。