《Computers and Education: Artificial Intelligence》:A systematic review of the impact of GenAI on learning performance, AI hallucinations, and problem-solving in computer science education
编辑推荐:
这篇综述系统梳理了64项实证研究,探讨了生成式人工智能(GenAI)在计算机科学教育(CSE)中如何通过个性化学习和自适应反馈,在编程、调试、算法推理和计算问题解决等场景塑造学习。文章揭示了GenAI的双重影响:一方面,其产生的幻觉或误导性输出会增加外在认知负荷,引发过度依赖,并因资源获取不平等或对文化语言多样性学习者支持不足而加剧教育不公,从而损害学习表现;另一方面,当嵌入结构化的公平的、教学有据的环境时,GenAI能通过促进自我监控、验证和策略调整来支持反思性编程实践,从而增强问题解决能力、参与度和个性化学习成果。该综述构建了一个整合概念框架,为理解GenAI如何重塑CSE中的学习提供了理论一致且立足教学实践的视角,也为设计公平、认知平衡且教学有效的GenAI支持型学习环境提供了可行见解。
在当今计算机科学教育(CSE)领域,生成式人工智能(Generative AI, GenAI)的浪潮正以前所未有的速度重塑着教学与学习的图景。以ChatGPT、GitHub Copilot、Codex、Gemini等为代表的工具,正从单纯的辅助角色,演变为能够提供动态、个性化支持的“学伴”乃至“导师”。然而,这把双刃剑在带来革新希望的同时,也引发了深切的忧虑:AI幻觉(AI hallucinations)的阴影、对系统生成内容的过度依赖(over-reliance),以及潜在的教育不公。这篇系统性综述,正是基于64项实证研究,对GenAI在CSE中如何影响学习表现、问题解决以及如何处理幻觉等核心议题,进行的一次深度“CT扫描”。
学习表现的双面镜:赋能与风险并存
GenAI对学习表现的影响并非单向。在积极的一面,当工具被巧妙地集成到结构化的教学环境中时,它们能成为强大的催化剂。例如,基于GenAI的智能辅导系统(Intelligent Tutoring Systems, ITS)和自动代码反馈工具,能够根据学习者的实时表现动态调整任务难度、提供个性化解释和脚手架式提示。这种自适应学习(Adaptive Learning)机制,有效管理了学习者的认知负荷(Cognitive Load),将挑战维持在其“最近发展区”内,从而显著提升了编程概念的理解、代码准确性和整体学术成绩。
然而,另一面的景象同样值得警惕。GenAI可能生成看似合理实则错误或误导性的输出,即“幻觉”。在编程学习中,这可能表现为语法正确但逻辑有误的“代码幻觉”(code hallucinations)。当学习者,尤其是新手,不加批判地接受这些输出时,不仅无法解决问题,其错误检测、自我监控和策略调整等元认知(Metacognitive)过程也会受到干扰。更深远的影响是,这种对自动化输出的依赖可能削弱学习者深入思考、独立调试和构建稳健问题解决策略的能力,长远来看反而损害了高阶思维技能的发展。
穿越幻觉迷雾:从认知干扰到元认知契机
AI幻觉无疑是GenAI融入教育核心的“阿喀琉斯之踵”。从认知负荷理论(Cognitive Load Theory, CLT)看,幻觉输出会显著增加学习者的外在认知负荷,迫使其将有限的认知资源用于甄别真假、调和矛盾,而非用于深度的概念理解和问题解决。这可能导致学习效率下降、理解肤浅,甚至形成错误的知识结构。
但有趣的是,综述也指出,处理幻觉的过程本身可以转化为促进深度学习的契机。根据元认知学习理论,当学习者被迫去验证、质疑和修正AI生成的内容时,他们实际上在主动进行自我监控(self-monitoring)、信心校准(confidence calibration)和错误检测(error detection)。这种“认知扰动”若能加以适当引导——例如,通过设计鼓励验证和反思的教学活动——反而能锻炼学习者的批判性思维和对AI输出的审辨能力,将潜在的威胁转化为培养数字时代核心素养的练习场。
迈向公平与包容:文化响应的GenAI
教育的成功不仅关乎认知,也深深植根于个人、社会与文化背景。然而,主流GenAI模型的训练数据往往反映西方中心视角,可能导致对文化、语言多元性学习者的支持不足,甚至产生带有偏见的输出,从而加剧教育不平等。这对旨在培养全球计算人才的CSE领域尤为重要。
幸运的是,GenAI也展现了成为文化包容性桥梁的潜力。通过检索增强生成(Retrieval-Augmented Generation, RAG)等技术,可以将课程特定材料、本土化示例或本土知识融入AI的回应中,生成更具文化相关性和语境适宜性的学习内容与评估。例如,已有研究尝试开发能够生成融合原住民知识、民族语言要素的 culturally responsive 课程计划和测评项目。尽管这类工具在生成本土化术语时仍可能产生“幻觉”,但它开启了通过技术手段弥合数字鸿沟、为多元化学习者创建更公平学习环境的新路径。
问题解决与高阶思维的锻造场
CSE的核心目标之一是培养复杂问题解决(problem-solving)和计算思维(Computational Thinking, CT)。GenAI在此领域的作用尤为微妙。一方面,它能即时提供代码示例、调试建议和算法解释,极大降低了入门门槛,增强了学习者的自我效能感(self-efficacy)和动机。研究表明,在GenAI辅助下,学习者的计算思维技能、编程自我效能感均能得到提升。
另一方面,风险在于“短路”思考过程。如果工具沦为提供“即食答案”的黑箱,学习者可能跳过本应经历的、富有成效的挣扎(productive struggle)——即定义问题、分解任务、设计算法、迭代调试的完整周期。这可能导致表面上的任务完成,却牺牲了对计算原理和设计模式的深层理解。因此,关键在于教学设计:是将GenAI定位为替代思考的“拐杖”,还是激发思考、协作解决问题的“伙伴”?综述强调,有效的整合应引导学习者与AI进行战略性对话,利用其进行头脑风暴、获取解释性反馈,而非直接索要最终解决方案。
构建未来学习生态:理论、设计与责任
综上所述,GenAI对CSE的影响是多重且交织的。它绝非简单的“好”或“坏”,而是其效益高度依赖于教学设计、系统实现和使用的社会文化背景。构建有效的GenAI支持型学习环境,需要一个整合了建构主义(Constructivist)、社会文化(Sociocultural)、认知负荷和元认知学习理论的坚实框架。
未来的方向在于设计“公平、认知平衡且教学有效”的GenAI系统。这意味着系统需要具备强大的上下文感知和个性化能力,同时内置防止过度依赖和验证输出的机制。对教育者而言,这提出了新的能力要求:不仅要熟悉GenAI工具,更要善于设计能利用其优势、规避其风险的教学活动,并培养学生的AI素养(AI literacy)——包括提示工程(prompt engineering)、输出验证和伦理使用的意识。
最终,将GenAI引入CSE课堂,不仅关乎教授编程,更是在模拟一个AI无处不在的未来工作场景。通过今天在受控教育环境中的探索、试错与学习,我们正在帮助下一代计算人才做好准备,让他们未来不仅能熟练使用AI,更能批判性地驾驭、负责任地塑造AI,使其真正服务于增强人类智能、解决复杂问题和创造更美好世界的宏伟目标。