《Computers and Education: Artificial Intelligence》:Integrating artificial intelligence and data envelopment analysis for sustainable efficiency assessment in higher education
编辑推荐:
本文推荐高等教育数字化转型背景下,资源投入与教学成效不匹配的难题。作者团队提出了一种融合数据包络分析(DEA)与人工智能(AI)的混合框架,用于评估课程层面的相对效率。通过对15门大学课程的分析,发现仅3门达到完全效率,其他课程存在5.4%至20.2%的效率差距,其中能源消耗和学习成果是关键影响因素。研究结果表明,基于AI的预测模型能够高精度预测效率(Random Forest和Gradient Boosting的R2> 0.90),并将可持续发展目标(SDG 4和12)指标纳入分析,证明了优化能源使用和公平数字访问管理可提升教育可持续发展指标。此研究为面向可持续性的、数据驱动的教育管理与决策支持提供了新路径。
高等教育正经历着快速的数字化转型,教学机构在技术基础设施和数字资源上的投入空前巨大。然而,一个令人困惑的矛盾现象也随之出现:这些不断增长的资源投入,并没有带来人们预期中成比例的教学成果提升。例如,学校可能配备了先进的在线学习平台和大量的数字教学工具,但学生的通过率、保留率和学习效果未必同步改善。同时,支持这些数字基础设施运行所产生的能源消耗,也给教育机构的可持续运营带来了新的挑战。这种资源投入与实际产出之间的“效率鸿沟”,凸显了对现有教育实践进行精细化评估的迫切需求。我们不仅需要了解资源用了多少,更需要知道这些资源是否被有效地转化为了可衡量的教育成果。特别是在高等教育环境中,广泛部署的数字基础设施与持续存在的学生辍学率并存,这使得效率问题变得更加复杂——效率不再等同于资源的丰富程度,而必须从相对生产力和可持续发展的角度来理解。
在此背景下,一篇发表于《Computers and Education: Artificial Intelligence》的研究为我们提供了一个创新的解决方案。来自厄瓜多尔Universidad de Las Américas的William Villegas-Ch等人,进行了一项题为“Integrating artificial intelligence and data envelopment analysis for sustainable efficiency assessment in higher education”的研究。该研究创造性地将传统的效率评估工具“数据包络分析(Data Envelopment Analysis, DEA)”与先进的人工智能(AI)预测模型相结合,旨在构建一个既能评估现状、又能预测未来、且充分考虑可持续性维度的课程效率分析框架。研究团队的核心目标是回答:在高等教育中,如何科学地评估课程将教学、技术和能源资源转化为学术成果的相对效率?哪些因素是关键驱动?以及,如何利用数据驱动的方法来支持可持续的、高效的教育管理决策?
为了系统回答上述问题,研究人员采用了多步骤的混合方法。数据主要来源于公开教育数据仓库(如LearnPlatform Educational Technology Dataset)以及从Moodle学习管理系统进行的受控试验,最终整合了500门课程级别的观测数据,并从中选取了15门代表性课程进行深度分析。研究方法主要整合了三大关键技术:1. 数据包络分析(DEA)建模:采用面向输出的BCC(Banker, Charnes, and Cooper)模型,将每门课程视为一个决策单元(DMU)。输入变量包括教学人员数量、技术投资、数字资源使用量、学生平均每周连接时间和服务器估计能耗;输出变量则涵盖通过率、课程保留率、学生满意度、完成率和综合学习成果指标。该模型用于计算每门课程相对于效率前沿的相对效率值(h)。2. 人工智能(AI)模型训练:利用DEA计算出的效率值作为监督标签,训练机器学习模型(包括Random Forest、Gradient Boosting和深度神经网络)来预测课程效率。这旨在复制DEA行为并实现对效率的前瞻性分析和情景模拟。3. 可持续性评估框架:研究将可持续性维度(对应联合国可持续发展目标SDG 4和SDG 12)操作化为具体的量化指标,包括基于工作量-千瓦时转换模型估计的能源效率、衡量数字资源访问公平性的公平指数(Eqj= 1 - σpj/μpj),以及作为辍学率代理的学生保留率。这些指标与DEA-AI框架整合,评估课程在环境和社会责任方面的表现。
4.1. 数据集描述分析
研究分析了500个决策单元(课程)的数据。输入变量如教师数量、技术投资、数字资源、连接时间和能源消耗均显示出显著的异质性,表明课程在资源分配和数字参与强度上存在巨大差异。输出变量如通过率(平均0.75)、保留率(平均0.68)、满意度(平均0.75)、完成率(平均0.60)和学习成果(平均0.70)则集中在中等至较高水平,且彼此间相关性较低(0.05–0.27),这为DEA模型提供了非冗余、多维度的绩效信息,避免了形成平凡的效率前沿。
4.2. DEA模型结果
应用DEA模型对15门课程进行分析后,结果显示仅有3门课程达到了完全相对效率(h = 1.0),它们构成了效率前沿。其余12门课程则表现出不同程度的效率不足,效率值在0.798到0.946之间,意味着相对于最优实践存在5.4%到20.2%的改进空间。分析表明,效率高低并不简单地与资源投入(如教师数量或技术投资)的多少成正比,而是与课程将资源(尤其是能源消耗)转化为关键教育成果(如学习成果和完成率)的能力更相关。
4.3. 人工智能预测结果
研究人员随后训练了多种AI模型来预测DEA得出的效率分数。其中,树集成模型表现优异,Random Forest和Gradient Boosting的预测精度很高(R2> 0.90),能够高保真地复现DEA的效率评估。特征重要性分析进一步揭示,在所有输入变量中,能源消耗和学习成果是对效率预测影响最大的两个决定性因素。这表明,在数字化教育环境中,能源使用效率和最终的学习成效是衡量课程可持续效率的核心。AI模型的成功应用,不仅验证了其作为DEA有效补充工具的可行性,也为在不重新运行复杂DEA模型的情况下,快速预测新课程或调整资源配置后的效率情景提供了可能。
4.4. 可持续性评估结果
将可持续性指标纳入分析后,研究发现了清晰的模式。能源使用效率更高的课程,其整体教育效率也倾向于更高。同时,数字资源访问更公平(即学生参与度差异小)的课程,表现出更低的辍学率和更高的学生保留率。定量分析显示,优化能源使用可以将可持续性指标提升多达12个百分点。这些发现将能源效率、数字包容性与学术绩效直接联系起来,表明社会和环境可持续性在数字化高等教育环境中与学术表现是结构性地交织在一起的。
该研究得出结论,将数据包络分析(DEA)与人工智能(AI)相结合的混合框架,为高等教育中课程层面的效率评估提供了一个强大且可解释的工具。该框架不仅能够静态地 benchmarking(基准测试)现有课程的相对效率,还能通过AI进行动态预测和情景分析。研究最重要的发现是,将可持续性维度——特别是能源消耗和数字访问公平——内化为效率评估的核心组成部分,而非外部附加标准,对于实现联合国可持续发展目标(SDG 4 优质教育和SDG 12 负责任消费和生产)在高等教育中的落地至关重要。能量消耗和学习成果被确定为区分高效与低效课程的最关键决定因素。
这项工作的意义在于,它响应了学界关于超越纯粹以资源或学术为中心的传统效率观念的呼吁,推动了教育分析学与更广泛的可持续性和政策目标相结合。它提供了一种可操作的、数据驱动的方法,帮助教育管理者和政策制定者识别效率改进的潜在领域,优化资源配置(尤其是在数字技术和能源方面),并最终在提升学术质量的同时,履行机构的社会与环境责任。该框架强调了解释性和前瞻性,使AI不仅仅是一个“黑箱”预测工具,更成为了支持可持续教育决策的透明化机制。