SEWING:一个可解释的集成机器学习框架,用于服装行业中缝纫工人工资增长的预测

《Expert Systems with Applications》:SEWING: An Interpretable Ensemble ML Framework for Sewing Operators’ Wage Increments Prediction in Garment Industry

【字体: 时间:2026年03月06日 来源:Expert Systems with Applications 7.5

编辑推荐:

  提出SEWING可解释机器学习框架,通过三阶段集成模型预测缝纫工加薪,结合SHAP和LIME分析,在四组数据集上实现R2 0.996,有效提升薪酬决策公平性、透明度和行业效率。

  
Bushra Akter|Shahzalal Khan Rahat|Motahara Sabah Mredula|Zannat Hossain Tamim|Md Sazzadur Rahman|A. S M Sanwar Hosen
孟加拉国达卡贾汉吉尔纳加尔大学信息技术学院

摘要

服装行业严重依赖缝纫操作员,他们的效率、技能和稳定性直接影响产品质量和整体生产力。确定公平透明的年度工资增长面临重大挑战,因为传统的评估方法往往具有主观性和不一致性,可能会影响员工的积极性。为了解决这些挑战,本文介绍了SEWING,这是一个可解释的机器学习框架,旨在预测缝纫操作员的年度工资增长。SEWING使用三层堆叠集成架构,结合了线性学习器(包括线性回归(LR)和岭回归(RR)以及极值梯度提升(XGBoost),还有多项式学习器(包括多项式LR和多项式RR),并通过一个包含残差校正层的堆叠式元学习器来提升预测性能。该模型在四个来自服装工厂的真实世界数据集上进行了评估,每个数据集包含十四个关键绩效指标。结果显示出高预测准确性,模型的平均R2为0.996,并且所有数据集的错误率都保持稳定。五折交叉验证进一步证实了模型的稳定性。可解释人工智能技术(包括Shapley加性解释和局部可解释模型无关解释)确定了效率、质量管理、操作技能、经验和出勤率是最有影响力的预测因素。通过将预测性能与可解释性相结合,SEWING提供了一种数据驱动的、以员工为中心的方法来自动化工资增长决策,从而促进服装行业的公平性、透明度和组织效率。

引言

成衣(RMG)行业对孟加拉国经济贡献巨大,约占国民生产总值的10.35%。该行业雇用了超过400万名工人,年增长率达7%,已成为全球第二大服装出口国(2023年数据)。除了经济贡献外,该行业还增加了就业机会、社会稳定性和女性赋权。然而,尽管取得了显著增长并在全球占据重要地位,RMG行业在维持生产力增长方面仍面临巨大挑战。
影响生产力的一个主要问题是缺乏与个人表现相匹配的工资增长,尤其是对于构成生产线支柱的缝纫机操作员而言。如图1所示,孟加拉国的劳动生产率落后于该地区的其他国家(2023年数据)。这一差距因工资政策未能充分认可或奖励员工的贡献而进一步扩大,导致员工积极性低、工作满意度下降和流动率上升。这种情况尤其影响缝纫机操作员,因为他们的收入往往无法反映他们在生产中的技能、效率和贡献(Jadu & Hamdan,2024年)。
目前RMG公司的工资增长方式仍主要依赖人工决策,效率低下。这一过程复杂、耗时,容易受到人为错误和主观偏见的影响。人工决策常常导致不公平的补偿——例如过度补偿或补偿不足,无法反映员工的实际贡献。这削弱了薪酬与生产力之间的联系,使得管理层难以有效激励员工。虽然研究人员已经在人力资源(HR)领域探索了一些机器学习(ML)应用(Author & Author,2023年;Balla, Rahayu, & Purnama,2021年),但大多数方法缺乏针对制造角色的绩效相关预测。因此,迫切需要一个自动化、数据驱动的系统,能够公平高效地预测工资增长,确保生产力与薪酬之间的更强一致性。
预测建模在优化劳动力管理、薪资预测和行业运营效率方面受到了广泛关注。研究表明,统计和机器学习方法在解决生产力损失、缺勤、出勤率等问题方面非常有用。在服装行业,已经开发出模型来预测生产力水平并识别影响员工表现的风险因素(Gebrye,2025年)。此外,整合分阶段操作员效率数据改进了生产计划和劳动力分配策略。尽管基于人工智能(AI)的薪资预测已在多个领域得到应用(Javed, Md Dawal, Nukman, & Ahmad,2022年;Lugay & Matias,2015年;Quan & Raheem,2023年;Racine, Chen, & Swift,1992年),但许多方法缺乏透明度,导致决策难以解释。可解释人工智能(XAI)方法(Arrieta等人,2020年;Jagannathan等人,2023年;Kreuzberger, Kühl, & Hirschl,2023年;Thalpage,2023年)通过提高可解释性提供了解决方案,使人力资源经理和员工能够理解工资调整背后的理由以及个人表现因素的贡献。
为了解决这些挑战,本文提出了一个结合线性和多项式特征提取与多种回归模型的机器学习框架,包括线性回归(LR)、岭回归(RR)、极值梯度提升(XGBoost)、多项式LR(二次方)和多项式RR(二次方)。这些基础学习器通过堆叠式元学习器集成,元特征通过梯度提升算法进一步优化,以提供高度准确的年度工资增长预测。该框架明确考虑了行业特定的生产力和行为因素,使得RMG行业的薪酬策略既公平又能激励员工。本文的主要贡献如下:
  • 本文提出了一个新颖的集成模型,能够更准确可靠地预测年度工资增长,支持公平和数据驱动的薪酬决策。
  • 它促进了工资决策的透明度和可解释性,增强了利益相关者之间的信任和责任感。
  • 本文还考虑了行业特定的生产力和行为因素,制定了定制的薪酬策略,激励员工并确保RMG行业的公平工资。
  • 它利用全面的数据集生成见解,帮助优化与工资相关的决策并提高劳动力表现。
  • 本文的其余部分结构如下:第2节回顾了现有方法;第3节描述了用于开发预测模型的方法;第4节提供了结果和讨论,分析了模型性能;最后,第5节总结了主要发现并指出了未来研究的方向。

    文献综述

    多年来,关于薪资预测及其在劳动力市场中的作用进行了大量研究。Becker等人(2009年)关于人力资本理论的早期工作为薪资预测模型奠定了基础。他们的研究采用了理论和实证经济建模方法,探讨了工资如何由获得的技能、教育和与生产力相关的属性决定。他们的框架明确了人力资本投资与收入之间的关系。

    方法论

    该方法论遵循一个结构化的工作流程,从四个服装工厂(Garment 1、Garment 2、Garment 3和Garment 4)收集数据开始,然后进行预处理、模型训练、评估、XAI应用和结果分析。图2展示了从数据处理到可解释性分析的整个流程。

    实验设置

    实验在Python 3.11环境下使用标准桌面电脑进行,配备Intel Core i5处理器和8 GB RAM。所有数据集使用相同的计算环境和软件设置,以确保结果的可重复性和比较的公平性。所提出的SEWING框架采用三级OOF堆叠架构,并进行了五折交叉验证(k=5),并设置了固定的随机状态42,以确保数据分割的确定性。

    结论

    本文提出了SEWING,这是一个数据驱动且可解释的框架,用于预测服装行业缝纫操作员的薪资增长。在四个真实世界数据集上的实证评估表明,该框架在保持可解释性的同时提供了可靠的预测性能。研究结果表明,劳动密集型制造业的薪资增长可以以系统化和透明的方式进行建模,从而支持基于数据的HR决策。

    数据集可用性

    本文使用的数据集来自四个服装工厂,包含有关操作员表现、薪资增长和内部HR评估的敏感组织信息。数据由各人力资源部门提供,并在获得工厂管理层事先许可的情况下以去标识化形式共享,其中直接的个人身份信息(如姓名和员工ID)未向研究人员披露。
    由于保密协议的原因,

    资金支持

    本研究得到了孟加拉国邮政、电信和信息技术部信息与通信技术(ICT)部门以及韩国Woosong大学学术研究基金2026年的财务支持。

    利益冲突声明

    作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:
    报告与...有关的关系。如果有其他作者,他们声明没有已知的可能会影响本文所述工作的财务利益或个人关系。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号