
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用社交媒体数据和机器学习来衡量人力资本
《Scientific Reports》:Measuring human capital with social media data and machine learning
【字体: 大 中 小 】 时间:2026年06月06日 来源:Scientific Reports 3.9
编辑推荐:
摘要在许多国家,关于细分地理层面教育成就的及时数据仍然十分匮乏,这限制了基于证据的政策制定。机器学习的最新进展使得可以利用卫星图像和手机记录等非传统数据来源来衡量发展指标。尽管这些方法在预测财富、贫困或人口密度等结果方面取得了成功,但此前尝试预测教育成就时的准确率却仅处于中等水平
在许多国家,关于细分地理层面教育成就的及时数据仍然十分匮乏,这限制了基于证据的政策制定。机器学习的最新进展使得可以利用卫星图像和手机记录等非传统数据来源来衡量发展指标。尽管这些方法在预测财富、贫困或人口密度等结果方面取得了成功,但此前尝试预测教育成就时的准确率却仅处于中等水平。在这里,我们发现社交媒体中的语言模式和用户行为可以解释地区教育成就差异的70%。我们的机器学习框架利用了来自美国和墨西哥的2500万条带有地理位置信息的推文中的语言特征、用户行为和网络特征。该模型在预测高等教育水平方面表现尤为出色,即使在数据收集周期较短的情况下也能保持良好的预测效果。这些结果表明,数字通信模式可以作为人力资本的可靠替代指标。鉴于全球范围内社交媒体使用的迅速普及,这种方法对于那些缺乏详细且及时调查数据的地区来说,是一种追踪教育成果的有前景的方式。