科学整合中学AI素养课程的设计：以青年与AI专家共同引导的设计研究法为例

《Computers and Education: Artificial Intelligence》：Design of a science integrated secondary school AI literacy curriculum: A youth & AI expert guided design-based research approach

【字体：大中小】 时间：2026年02月23日 来源：Computers and Education: Artificial Intelligence CS28.7

编辑推荐：

　　本文针对当前高中科学课程难以有效整合人工智能与机器学习教学、且缺乏对青年视角关注的挑战，介绍了一项为期两年、基于设计研究的迭代式课程开发工作。研究团队通过吸纳项目校友和行业专家组成咨询委员会，构建并迭代了一个为期四周的夏季非正式科学教育项目中的机器学习整合课程。结果显示，参与者在机器学习知识方面均有显著提升，且第二组参与者的学习收获（M2-M1=0.175， p < 0.001， n=42）高于第一组（M2-M1=0.076， p < 0.001， n=35）。特别值得注意的是，自认为女性和非白人身份的学习者往往表现出比白人和男性同龄人更大的学习收益。这项研究提供了一个成功以青年意见为核心的参与式课程设计范例，为希望将AI/ML有效整合到现有课程中的教育设计者提供了重要参考。

随着人工智能（AI）和机器学习（ML）技术日益渗透到我们生活的方方面面，从娱乐休闲到科研探索，教育工作者正面临着一个紧迫的挑战：如何重新设计课程，以一种与年轻人相关且引人入胜的方式，将人工智能和机器学习的方法整合到现有教学体系中。科学学科为这种整合提供了理想的情境，因为机器学习在现代科学研究和发现中扮演着越来越关键的角色。然而，将AI/ML有效且可持续地融入K-12现有课程并非易事，尤其是对于高中生而言，机器学习的概念常常抽象且复杂，同时还需要考虑到伦理和社会影响。因此，一个核心问题在于：如何开发一种非正式的、整合科学的机器学习课程，既能传授核心知识，又能激发学习兴趣，并且能有效惠及来自STEM领域历史上代表性不足群体的青少年？

针对这一挑战，马萨诸塞州理工学院STEP实验室的Katherine S. Moore、Gabrielle Rabinowitz、Safinah Ali、Mark Weckel、Irene Lee、Preeti Gupta和Rachel Chaffee组成的研究团队，开展了一项基于设计研究（Design-Based Research， DBR）的混合方法研究。该研究发表于《Computers and Education: Artificial Intelligence》。研究团队对一个已有的、旨在培养STEM劳动力准备的夏季学院（Summer Institute， SSI）课程进行了重新设计，重点是突出机器学习的方法和技能。他们采取了一个独特的创新方法：在整个为期两年的迭代设计过程中，每一步都融入了由项目校友和行业领域专家组成的咨询委员会的意见。通过一系列“倾听之旅”（listening tours），研究者们确保了课程内容与真实世界的STEM产业相关，并建立了有效教授与新兴技术相关的关键概念和技能的最佳实践。

为了衡量课程的有效性，研究者们还共同开发了一种专门用于评估机器学习知识和技能的测量工具——机器学习概念量表（ML Concept Inventory， MLCI），以评估学习成果。通过在两批不同的学生群体中实施课程并收集数据，他们不仅评估了课程的效果，更重要的是，展示了如何通过以青年和专家意见为中心的设计过程，迭代地优化一个AI/ML整合课程。结果表明，参与者在机器学习知识方面均有显著提升，且第二组参与者的学习收获高于第一组。一个引人注目的发现是，自我认同为女性和非白人的参与者在学习收益上往往超过其白人和男性同龄人。这项研究为教育设计者提供了一个范例，展示了如何通过将青年声音置于核心地位，成功地将AI/ML整合到现有课程中。

研究人员开展这项研究主要运用了以下几个关键技术与方法：基于设计的研究（DBR）框架是核心方法论，指导了“设计-测试-评估-反思”的迭代循环，并强调将青年和专家的观点纳入设计的每个阶段。研究采用了混合方法分析，结合了定量与定性数据。定量评估使用了自行开发的机器学习概念量表（MLCI），通过配对t检验等方法分析学生在课程前后的知识变化，并考察了不同人口统计学群体（如性别、种族）的学习收益差异。定性数据收集则通过半结构化访谈和课堂观察进行，访谈对象为部分课程参与者，旨在了解他们的学习体验、遇到的挑战以及对课程特定活动的看法，而观察则用于评估课堂参与度和教学策略的有效性。研究还应用了干扰项分析，通过分析学生在测验中选择错误答案的模式，识别他们对机器学习概念可能存在的常见误解，进而为课程内容的修订提供依据。此外，课程设计本身融合了多种教学法框架，例如借鉴了Lao的机器学习教育框架，强调“使用-修改-创建”的学习进阶，并引入了脚手架式教学、体验式学习、基于问题的学习以及无代码平台（如Wallace）等手段，以降低技术门槛，增加课程的普适性和趣味性。

研究结果

3.1. 第一轮设计与实施

在课程设计的第一阶段，研究者通过“倾听之旅”和文献研究确定了核心学习目标与教学方法。咨询委员会的意见强调了减少数学和代码记忆、鼓励小组协作解决问题、培养自我效能感而非单纯追求成绩的重要性。课程引入了线性回归、K均值聚类、决策树和人工神经网络等与自然科学相关的ML技术，并采用AIMSinDS课程的三步脚手架方法：概念介绍、通过参与式模拟强化学习、在编码环境（Google Colab）中应用。课程使用了一个与博物馆研究员工作相关的系外行星数据集，并在最后一周引入了一个流程图，帮助学生判断在何种情境下使用机器学习是合适的。

实施后的评估显示，参与者在机器学习的一般知识上取得了显著进步（p < 0.001）。然而，数据分析也揭示了一个明显的性别差距：尽管女性和非二元性别参与者的知识增益显著，但男性参与者在课程前后的平均得分始终更高，表明课程未能完全弥合学习起点上的性别差异。课堂观察发现，学生对互动性强的活动（如模拟、视频讨论）参与度很高，但在涉及数据处理和编码的活动（如使用Google Colab）中，参与度降低且表现分化严重，这反映了学生们在编程经验和技能上的差异。

对学生的访谈分析揭示了三类积极的学习体验：互动活动、Google Sheets的使用、以及与真实世界应用的结合（例如在实地考察中使用的相机陷阱技术）。同时，访谈也指出了三个有待改进的领域：部分学生认为Google Colab编码活动令人生畏，并因此影响了他们对未来ML相关研究机会的兴趣；系外行星数据集被认为较难理解；小组合作有时未能让所有学生都感受到充分的归属感。

3.2. 第二轮设计与实施

基于第一轮的评估与反思，研究团队对课程进行了重大修订，形成了第二轮课程。主要修改包括：减少并多样化编码体验，增加了对Python和Google Colab的引导式入门，并将决策树的Colab活动调整为分层教学，设置了自主学习站、教师引导的小组学习站和结对编程站，以适应不同学习节奏的学生。引入无代码平台，用Wallace（一个用于物种生态位建模的R语言平台的可视化界面）替换了部分编码活动，使学生能专注于完整的机器学习流程（从数据获取到模型预测可视化）而不必编写代码，并将无监督学习案例从K均值聚类替换为Wallace内置的主成分分析（PCA）。采用更具实感的数据集，用蜻蜓翅膀特征数据集和城市行道树数据集取代了抽象的系外行星数据集，并配合了实地观察活动（如测量树围），使数据更具体、易于理解。

实施第二轮课程后的评估显示，学习成效得到进一步提升。第二组参与者在机器学习一般知识上的得分提升（M₂-M₁=0.175， p < 0.001， n=42）显著高于第一组（M₂-M₁=0.076， p < 0.001， n=35）。更重要的是，学习收益的群体差异模式发生了变化。在第二轮中，女性和非二元性别参与者（d = 1.489）以及非亚裔少数族裔参与者（d = 1.798）取得了非常大的学习增益，其效应量甚至超过了亚裔或白人参与者（d = 1.058）。这表明修订后的课程在促进教育公平、帮助起点较低的学生群体实现更大提升方面可能更为有效。

结论与讨论

本研究通过一个为期两年的设计研究过程，成功开发并迭代了一个整合科学的中学人工智能素养课程。研究不仅验证了课程在提升高中生机器学习知识方面的有效性，更重要的是，它展示了一个以青年和专家意见为核心、持续迭代的课程设计模型的可行性与价值。咨询委员会（尤其是项目校友）的深度参与，确保了课程内容既与行业前沿相关，又贴合学习者的实际经验和需求。

课程迭代的关键改进——减少编码障碍（通过引入分层教学和无代码平台）、采用具体且相关的数据集、以及强调互动与真实世界应用——被证明是有效的。这些调整不仅整体上提升了学习成效，更显著地缩小了不同背景学生（尤其是女性和少数族裔学生）的学习差距，促进了更大的教育公平。

这项工作为希望将AI/ML整合到现有课程（尤其是在非正式学习环境中）的教育者提供了宝贵的经验和设计原则。它证明了，通过精心设计的脚手架、重视学习者身份认同的建立、并持续倾听关键利益相关者的反馈，可以创建出既具有学术挑战性又具有包容性和吸引力的机器学习教育项目。最终，这项研究为推动人工智能教育普及、培养未来多元化STEM人才队伍提供了一个可复制的实践范例。

热点排行

新闻专题