缓解职业系统中的技能测量偏差:一种与收入预测相结合的编码器-解码器框架

【字体: 时间:2026年03月04日 来源:Big Data Research 4.2

编辑推荐:

  职业技能评估与收入预测的神经网络方法研究。本文提出融合O*NET专家数据库与IPUMS收入数据集的神经网络框架,通过编码器-解码器结构实现职业技能动态调整,并构建职业与个人双维度收入预测模型,有效降低传统调查成本与机器学习偏差,提升技能评估时效性与准确性。

  
张潘|李艳艳|王炳豪
中国烟台大学数学与信息科学学院

摘要

要理解劳动力市场及其社会经济结果,就需要对职业技能进行准确的量化。传统的方法,如市场调查,可能成本高昂且存在偏见,而数据驱动的方法往往覆盖范围有限,且过度依赖机器学习技术。在这项研究中,我们提出了一种基于神经网络的方法,利用现有的数据库(如O*NET和IPUMS)重新评估职业技能。我们的框架将技能重新评估和收入预测结合为一个协作任务,包括使用编码器-解码器神经网络进行技能评估的模块,以及预测职业和个人收入的模块。这种方法消除了通过市场调查进行持续更新的需要,并能够快速调整技能评估。最重要的是,它可以自动减轻当前职业体系中存在的偏见。与以往对在线招聘数据的分析相比,使用现有的职业数据库评估不仅融入了潜在的专家知识,还减少了对机器学习的过度依赖。

引言

职业是根据共享的技能、职责和责任对各种工作的分类[1],[2]。从职业的角度来看,职业包含了全面的技能集合,这挑战了技能是个人和雇主之间交换的孤立属性这一观念[3]。量化职业技能不仅有助于更好地理解劳动力市场中的各种现象,还为了解社会中不同职业的结构和功能提供了宝贵的见解[4]。从个人的角度来看,了解技能要求可以作为个人职业发展的参考。它使个人能够仔细规划职业路径,评估个人技能,并提高在工作场所的竞争力。它还有助于技能匹配,使个人能够更好地适应劳动力市场的需求[5],[6]。在更广泛的层面上,关于量化职业技能的数据可以帮助政府了解就业状况,制定有效的政策,并促进经济增长和竞争力[7],[8]。此外,职业技能的衡量在社会科学研究中也很重要,以识别和解决社会不平等问题[2]。
然而,量化职业技能要求远非易事,因为它需要整合不同的观点,进行彻底的研究,并创建可靠的评估工具来有效衡量职业技能。基于市场调查的方法在历史上在这个领域发挥了关键作用,例如《职业名称词典》(DOT)[2]及其后续版本《职业信息网络》(O*NET)[9]等基础文献所示。这些调查收集了工人、雇主和专家的反馈,提供了关于劳动力市场复杂性的宝贵见解。然而,市场调查严重依赖于受访者和专家知识,因此成本高昂,难以更新,并且容易产生偏见[3],[10]。
近年来,由于丰富的数据资源,数据驱动的机器学习方法作为衡量职业技能的有希望的替代方案应运而生[11],[12],[13],[14]。诸如[6],[15],[16],[17]之类的研究收集了在线招聘数据来分析职业技能要求。这些方法提供了更及时和更具成本效益的评估,为工作技能的需求和重要性提供了宝贵的见解。然而,数据驱动的方法仍然面临挑战,例如过度依赖机器学习以及缺乏与专家知识的有效整合。
在这项研究中,我们提出了一个成本效益高的框架,用于量化职业技能要求,该框架结合了专家知识和数据驱动的调整。我们认为,当前的职业系统(如O*NET)依赖于全面的调查和专家判断,提供了关于各职业技能要求的宝贵且可信的见解。尽管存在一些批评[3],[10],但这些措施可以通过辅助数据源进行改进。我们还利用了技能要求与收入之间的已知联系[4],[5],将收入作为技能价值的直接指标。基于这些见解,我们的方法采用了一个机器学习模型,该模型将O*NET数据与综合公共使用微观数据系列(IPUMS)[1]中的个人记录相结合,以重新评估技能要求。一个受到偏差惩罚机制约束的编码器-解码器架构确保调整后的技能估计值与原始专家评估值保持接近。此外,在人力资本理论的指导下,该框架包括两个收入预测模块:一个职业层面的模块,将重新评估的技能与平均和中等职业收入对齐;一个个人层面的模块,通过人口统计和个人属性捕捉职业内的变异性。这些模块共同确保重新校准的技能准确反映了目标年的实际收入。与传统基于调查的方法相比,我们的方法既具有成本效益又具有灵活性。此外,它适用于不同的劳动力市场和时间段:只要劳动力市场提供了目标年的原始职业技能评估和相应的收入数据,模型就可以无需进行大规模的额外调查即可重新校准技能要求。
文章的其余部分组织如下。第2节回顾了基于市场调查和数据驱动的职业技能量化研究的相关文献。第3节介绍了我们提出的方法,该方法包括三个协作模块。第4节首先概述了使用的数据集,然后展示了实证分析结果。第5节讨论了研究结果,指出了局限性,并概述了未来的工作方向。

部分摘录

基于市场调查的职业系统

职业信息系统提供了关于不同职业的详细信息,包括所需的技能、知识和职责。这些系统在帮助个人、雇主、教育机构和政府制定有效的劳动力市场和职业发展策略方面发挥着关键作用。历史上,它们在构建职业信息系统时严重依赖于市场调查和专家判断。
例如,在美国,

提出的方法

我们的研究旨在克服现有职业数据库的局限性。虽然这些数据库提供了可信且稳定的技能衡量标准,并且在更新过程中变化很小,但它们成本高昂,维护起来耗时,并且由于响应率低或社会期望效应等原因容易产生偏见(如高估)。这种低效率和潜在的不准确性促使我们开发一种更有效的方法,该方法利用现有数据的稳定性,同时解决

数据来源

我们的实验使用了两个主要数据集。第一个是O*NET(https://www.onetonline.org/),它提供了各种职业的详细技能衡量标准。遵循[31]中的方法论,我们关注35项特定的职业技能(表1),这些技能与数据、人员和事物相关。根据最新的O*NET-SOC分类法,职业被分为459个广泛职业、98个次要群体和23个主要群体。我们的分析主要集中在98个次要群体上,对应于

结论

为了克服基于传统调查和纯数据驱动的方法在职业技能评估方面的局限性,我们提出了一个深度学习框架,该框架使用收入数据重新校准技能衡量标准。该框架整合了三个核心模块:技能重新评估(SA)网络、职业收入预测器(OIP)和个人收入预测器(IIP)。通过利用专家整理的O*NET职业数据以及来自IPUMS-USA的大规模个人收入记录,

未引用的参考文献

缺失的引用 [37],[38],[39],[40]

CRediT作者贡献声明

张潘:撰写——原始草稿、软件、方法论、概念化。李艳艳:撰写——审阅与编辑、监督、方法论、概念化。王炳豪:验证、软件、方法论。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号