FARENet:一种基于频率自适应的鲁棒增强网络,用于利用可见光相机进行智能矿物分选

《Minerals Engineering》:FARENet: A frequency-adaptive robust enhancement network for intelligent mineral sorting with visible-light cameras

【字体: 时间:2026年02月11日 来源:Minerals Engineering 5

编辑推荐:

  矿物分类智能模型在复杂工业环境中的应用研究。提出FARENet网络架构,包含频率自适应增强模块、多尺度通道自适应融合模块和鲁棒特征扰动模块,通过构建真实工业场景矿物数据集RMCD验证模型在噪声干扰和计算资源受限条件下的有效性,实现90.9% Top-1精度仅消耗1.03 GFLOPs。

  
陶叶|陈润祺|梅在康|葛世荣
中国矿业大学(北京)机电工程学院,北京100083,中国

摘要

矿物分类对于资源优化和环境保护至关重要,但在恶劣的工业环境和有限的计算资源条件下仍面临挑战。为了解决这个问题,我们提出了一种频率自适应鲁棒增强网络(FARENet),并构建了一个真实的矿物分类数据集。FARENet包含三个核心模块:频率自适应增强模块(FAE),利用多频段可学习的频域增强来适应性地放大稳定结构并抑制噪声,从而实现高鲁棒性和细粒度特征区分;多尺度通道自适应融合模块(MCAF),它将多尺度特征与通道自适应增强相结合,以捕捉局部纹理和全局结构;以及鲁棒特征扰动模块(RFP),该模块引入多维结构扰动以显著提高对噪声和冗余特征的鲁棒性,在推理过程中仅进行恒等映射,且不增加计算开销。实验表明,FARENet在RMCD数据集上的Top-1准确率达到90.9%,仅需要1.03 GFLOPs的计算量,显著优于其他模型。鲁棒性和跨数据集泛化研究进一步验证了其在恶劣工业条件和多样化矿物分类任务中的适应性。

引言

在矿产资源开发和利用过程中,对多种矿物的精确分类具有重要的经济和环境意义(Liu等人,2023年)。高岭土和白砂岩是陶瓷和建筑等行业的重要原材料,而如果不能有效区分和管理绿矸石和黑矸石等废石,不仅会降低宝贵资源的利用效率,还会造成环境污染和安全隐患。因此,准确高效的矿物分类方法对于优化矿物分选过程、提高资源利用率和确保操作安全至关重要。
目前,主流的智能矿物分选系统主要依赖于基于辐射的传感器,包括γ射线(Watt和Steffner,1985年)、拉曼光谱(Ishikawa和Gulick,2013年)、X射线透射(XRT)(Robben等人,2020年)和X射线荧光(XRF)(Li等人,2020a年)技术。然而,这些方法的处理时间较长、成本较高,并且存在潜在的健康风险,限制了它们的广泛应用和可持续性。
传统的矿物图像分类方法依赖于基于颜色和纹理的手工特征,这些方法往往效率低下且需要特定的专业知识。一些经典分类器,如决策树(Breiman,1996年)、k近邻(Hall等人,2008年)和朴素贝叶斯(Rish等人,2001年),在小数据集上可以取得满意的性能。然而,它们在不同环境条件下的泛化能力严重受限,并且高度依赖于图像质量,导致矿物分选效率较低(Liu等人,2021b年)。近年来,基于深度学习的图像分类方法发展迅速,在各种任务中表现出色(Ye等人,2023年;Rui等人,2025年;Xu等人,2025年;Chen等人,2024年;Feng等人,2024年)。通过利用卷积神经网络的表示能力,这些方法减少了对高分辨率图像的依赖,简化了训练流程,并加速了分类速度。实证证据表明,深度学习方法在效率和准确性方面都优于传统技术。因此,机器学习驱动的矿物图像分类成为工业矿物分选应用中一个有前景的关键技术(Zhou等人,2022年;Gao等人,2024年;Nesteruk等人,2023年;Zeng等人,2021年)。然而,由于矿物分选环境的恶劣条件,仍存在一些挑战:(1)现有的公共数据集主要包含在受控实验室条件下获得的矿物图像,例如水洗样品。尽管这些图像中的特征明显,但它们不能准确反映实际工业环境的复杂情况,限制了模型的实际应用;(2)在现实世界场景中,图像经常受到模糊、噪声和采集条件变化的影响,背景复杂且纹理不清晰,使得模型难以有效捕捉区分性特征;(3)在动态和不可预测的环境中,模型容易受到多源扰动的影响,这大大限制了它们的泛化能力和整体鲁棒性;(4)现有工业设备的计算资源有限,对模型复杂性和效率提出了严格限制。
为了解决这些挑战,本研究构建了一个真实的矿物数据集,该数据集忠实再现了实际分选现场的条件,并引入了FARENet,这是一种新型的频率自适应鲁棒增强网络,用于智能矿物分选。首先,频率自适应增强模块(FAE)将频域增强信息与空间特征结合,有效抑制高频噪声的同时保留多尺度结构细节。接下来,多尺度通道自适应融合模块(MCAF)模块自适应地整合特征并增强通道显著性。最后,在训练过程中,加入鲁棒特征扰动模块(RFP),显著提高了模型的鲁棒性和泛化能力,而无需引入额外参数。本工作的主要贡献总结如下:
  • 数据集和算法开发:在本研究中,我们构建了一个在恶劣操作条件下捕获的真实矿物分类数据集,并设计了一个轻量级的频率自适应鲁棒增强网络(FARENet),以在具有挑战性的环境中实现强大的性能。
  • 频率自适应增强模块(FAE):我们引入了一个频率自适应增强模块,该模块策略性地融合频域线索与空间表示,以选择性地放大稳定的多尺度结构,同时抑制破坏性的高频噪声。
  • 多尺度通道自适应融合模块(MCAF):我们提出了一个多尺度通道自适应融合模块,该模块自适应地整合跨尺度特征并精细调节通道权重,从而精确捕捉矿物的局部纹理和全局结构。
  • 鲁棒特征扰动模块(RFP):鲁棒特征扰动模块在训练过程中向特征图中注入多源可学习的扰动,以增强模型的鲁棒性,并在推理过程中禁用,不会增加额外的计算成本。
本文的其余部分结构如下。第2节回顾了基于深度学习的图像分类技术和现有的矿物分类与检测研究。第3节详细介绍了本研究提出的方法。第4节展示了所提出方法的有效性。最后,第5节总结了本文并讨论了未来工作的潜在方向。

相关研究

相关工作

随着深度学习的快速发展,它在各种任务中展示了巨大的潜力。本节主要回顾了基于深度学习的图像分类方法和当前的矿物分类研究现状。

方法

在真实的矿物分选场景中,灰尘遮挡和不均匀照明等不利条件往往导致矿物特征模糊不清。这些挑战要求模型具有强大的鲁棒性和泛化能力,同时还要满足资源有限工业设备对参数大小和计算复杂性的严格要求。为了解决这一挑战,我们提出了一种轻量级的网络架构FARENet。

实验与结果

在本节中,我们首先介绍了真实矿物分类数据集(RMCD)的构建,然后评估了FARENet在实际条件下的性能。为了验证所提出方法的有效性,我们还进行了消融研究、鲁棒性评估和泛化评估。为了公平性,所有比较方法都在相同的设置下进行训练和评估。我们使用了AdamW优化器(学习率mrow>5\times mrow>0^{-4,权重衰减0.05,mrow>β19),mrow>β2

结论

在本研究中,为了解决缺乏在真实恶劣工业条件下捕获的矿物图像数据集的问题,以及现有模型在存在灰尘覆盖等噪声干扰时的鲁棒性和泛化能力不足的问题,以及工业设备计算资源有限的限制,我们构建了一个真实的矿物数据集,并提出了一种频域自适应鲁棒增强网络FARENet。本研究的主要观点总结如下:

CRediT作者贡献声明

陶叶:方法论。陈润祺:形式分析。梅在康:软件。葛世荣:资金获取。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。

致谢

本工作得到了国家自然科学基金(编号52374166、51374165)、北京自然科学基金(L221018)和中央高校基本科研业务费(2024ZKPYZJD04)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号