
-
生物通官微
陪你抓住生命科技
跳动的脉搏
关于负责任人工智能的数据集文档:分析数据集在健康领域的适用性和使用情况
《npj Digital Medicine》:Dataset documentation for responsible AI: analysis of suitability and usage for health datasets
【字体: 大 中 小 】 时间:2026年05月10日 来源:npj Digital Medicine 15.1
编辑推荐:
摘要人工智能(AI)正在迅速改变医疗行业,但同时也引发了人们对算法偏见的担忧,这些偏见主要源于训练数据。普遍认为,透明的数据集文档编制是实现负责任的人工智能开发的关键。已经建立了几种标准化的数据集文档编制方法,例如数据表(Datasheet)、数据集营养标签(Dataset Nu
人工智能(AI)正在迅速改变医疗行业,但同时也引发了人们对算法偏见的担忧,这些偏见主要源于训练数据。普遍认为,透明的数据集文档编制是实现负责任的人工智能开发的关键。已经建立了几种标准化的数据集文档编制方法,例如数据表(Datasheet)、数据集营养标签(Dataset Nutrition Label)、责任文档编制(Accountability Documentation)、健康信息表(Healthsheet)和数据卡(Data Card)。然而,这些方法是否适用于健康数据集以及其实际使用情况仍然不明确。在这项分析中,我们比较了这五种方法,并评估了它们与“STANDING Together Recommendations for Documentation of Health Datasets”(健康数据集文档编制建议)的一致性。我们还研究了这些方法在现实世界中的应用情况,并收集了数据集生成者和使用者的反馈。研究结果表明,没有任何一种文档编制方法被广泛使用或完全适用于健康数据集。我们建议制定一种标准化的健康数据集文档编制方法,并配备明确的指导原则和自动化工具以促进其推广。
生物通微信公众号