基于滑动窗口特征提取和权重自适应随机森林的TBM隧道岩体等级识别方法

《Expert Systems with Applications》:A sliding window feature extraction and weight adaptive random forest-based method for TBM tunnel rock mass grade identification

【字体: 时间:2026年01月25日 来源:Expert Systems with Applications 7.5

编辑推荐:

  准确感知隧道掘进机(TBM)地质条件对岩体分级和施工安全至关重要。本文提出基于滑动窗口特征提取与自适应随机森林的岩体分级方法,通过数据预处理(参数筛选、离群点检测、数据归一化)提取地质相关信息特征,并创新性地采用粒子群优化算法自适应调整类别权重。实验表明该方法相比传统随机森林提升1.9%-4.9%,特征提取模块性能提升12.1%,在复杂地质条件下的工程应用中展现出显著优势。

  
余洪刚|徐树展|尹欣|马赫迪·哈桑尼帕纳
湖北省岩土与结构工程安全重点实验室,武汉大学土木工程学院,中国湖北武汉430072

摘要

识别隧道围岩的等级是分析围岩稳定性和预测隧道掘进机(TBM)性能的基础。目前利用TBM的掘进参数来识别围岩等级的研究通常忽略了掘进参数变化中包含的地质信息,而机器学习方法也很少考虑类别权重的影响。因此,本文提出了一种基于滑动窗口特征提取和权重自适应随机森林的围岩等级识别方法。首先对原始数据进行处理,包括基于经验的参数筛选和随机森林、基于孤立森林的异常值检测等。随后提出了一种新的基于滑动窗口的特征提取方法,可以从掘进参数的变化中提取与地质相关的特征。最后提出了一种权重自适应随机森林算法,并使用粒子群优化来获得最优类别权重。通过一个输水项目的现场数据验证了所提方法的有效性。结果表明,与直接使用掘进参数作为模型输入相比,所提出的滑动窗口特征提取方法可以显著提高模型的性能。此外,所提出的权重自适应随机森林算法能够有效抑制由于不同类别之间高相似性导致的误分类,其性能优于随机森林、自适应提升、极端梯度提升和LightGBM算法。因此,所提出的方法能够准确识别围岩等级,具有重要的工程价值。

引言

隧道掘进机(TBM)广泛应用于交通、采矿、市政和引水工程(Liu等人,2016年;Yu等人,2021b年;Yu等人,2023a年;Zhou等人,2022年;Qin等人,2023年;Zhang等人,2014年)。然而,TBM的性能受到围岩条件的极大影响(Yu等人,2023b年;Rostami,2016年)。此外,操作人员通常无法观察到隧道前方的情况,也无法直接获取围岩等级等信息,从而导致TBM施工中的不确定性和风险。精确感知地质条件是进行围岩稳定性分析、TBM掘进性能预测、灾害预警等重要任务的基础(Chen等人,2025b年;Wang等人,2017年;Yu等人,2021a年;Yu等人,2023b年;Yin等人,2024年;Xu等人,2025c年;Zhao等人,2025年;Wang等人,2021年;Huang,2017年;Hasanpour等人,2020年;Koizumi等人,2016年;Sissins和Paraskevopoulou,2021年)。因此,准确感知地质条件具有重要的工程价值。
TBM隧道地质条件识别方法大致可以根据数据来源分为四种类型:基于岩屑图像的方法(Gong等人,2021年;Dong等人,2025年;Yu等人,2026年)、基于前方地质勘探的方法(Li等人,2025b年;Chen等人,2023年;Liu等人,2024年)、基于振动信号的方法(Yang等人,2025c年;Tang等人,2025年;Nilot等人,2023年)以及基于掘进参数的方法(Huang等人,2025b年;Katuwal等人,2024年;Li等人,2023a年)。得益于人工智能技术的快速发展(Xia等人,2023a年;Xia等人,2023b年;Dong等人,2023年;Xu等人,2025a年;Xu等人,2025b年;Bigdeli等人,2021年;Karami等人,2021年;Naghsh等人,2021年;Shishegaran等人,2023年;Xia等人,2023c年;Wang等人,2024年;Yu等人,2025年;Qin等人,2024年;Huang等人,2025a年;Wang等人,2025年;Li等人,2025a年;Aghajari和Namin,2024年;Yin等人,2025年;Daniel等人,2025年;Zheng等人,2024年;Ma等人,2024年;Chen等人,2025a年;Du等人,2024年;Lian等人,2024a年;Lian等人,2024b年),越来越多的数据驱动方法被应用于地质条件的感知。尽管基于岩屑图像的方法受到了越来越多的关注,但其实时性能相对较差,因为从岩石被切割到岩屑被拍摄需要一定的时间。基于前方地质勘探的方法主要用于获取隧道前方较远距离内的不利地质信息。目前基于振动信号的研究较少,主要原因是在恶劣环境中获取振动信号具有挑战性。这三种方法在识别地质条件方面都存在局限性。因此,主流方法是基于TBM运行数据来感知地质条件。
基于掘进参数的方法主要包括基于机器学习的方法和基于深度学习的方法。Yu等人(2022年)提出了一种基于受限密集卷积自动编码器和深度神经网络的半监督方法,用于TBM隧道地质构造识别,该方法能够充分利用标记和未标记的数据。Man等人(2024年)提出了一个PCA-GRU模型用于围岩等级分类预测,将主成分分析(PCA)与门控循环单元(GRU)结合以提高模型的识别精度。Wu等人(2025年)提出了一种集成学习框架,将特征增强深度神经网络(E-DeepFM网络)与基础模型(如支持向量机和k最近邻)相结合,结果表明E-DeepFM网络的集成能够显著提升基础模型的性能。还有一些近期研究尝试将其他来源的数据纳入掘进数据中以进一步提高模型性能。Yang等人(2025b年)开发了一个特征融合框架,利用TBM掘进数据和切割头磨损数据来预测围岩等级,结果表明耦合模态融合策略能够显著提升随机森林和卷积神经网络模型的性能。深度学习方法通常比机器学习方法具有更高的精度;然而,它们在跨场景和跨项目应用中容易过拟合。同时,多源数据融合的建模方法对数据采集系统的可靠性要求更高。机器学习方法通常具有更好的泛化性能,应用前景良好。Yin等人(2022年)采用了五种集成学习方法构建围岩等级识别模型,结果表明LightGBM模型取得了最佳性能。Guo等人(2022年)使用随机森林算法建立了围岩等级分类模型,并确定了围岩的完整性和可挖掘性。Hu等人(2023年)基于PCA和随机森林算法建立了围岩参数预测模型,结果表明该模型能够准确预测石英含量、完整性系数、单轴饱和抗压强度(UCS)以及单位体积岩石中的节理数量。Yang等人(2025a年)使用经过灰狼优化、蛾火优化和贝叶斯优化的随机森林算法构建了三个混合模型来识别围岩等级,结果表明经过蛾火优化的模型表现最佳。然而,上述研究通常直接将掘进参数作为模型输入,而没有考虑掘进参数变化中蕴含的地质信息。同时,随机森林是最广泛使用的机器学习方法之一,但传统的随机森林算法在分类任务中为不同类别设置相同的权重,无法有效抑制由于不同类别样本之间的高相似性导致的误分类。
本研究提出了一种基于滑动窗口特征提取和权重自适应随机森林的TBM隧道围岩等级识别方法,该方法可以从掘进参数的变化中提取地质特征,并自适应调整不同类别的权重以提高模型性能。首先提出了一套数据预处理方法。其次提出了一种新的基于滑动窗口的特征提取方法。最后开发了一种新的权重自适应随机森林算法,能够自适应调整类别权重。本工作的主要贡献如下:
(i) 提出了一种基于滑动窗口特征提取和权重自适应随机森林的TBM隧道围岩等级识别方法。
(ii) 提出了一套数据预处理方法,包括基于随机森林的参数选择、基于孤立森林的异常值检测和基于传感器范围的数据归一化。
(iii) 开发了一种新的基于滑动窗口的特征提取方法,可以从掘进参数的变化中提取地质信息,并将模型性能提高12.1%,相比直接使用掘进参数作为输入。
(iv) 所提出的权重自适应随机森林算法能够自适应确定最优类别权重,以抑制由于不同类别样本之间高相似性导致的误分类,其准确率分别比随机森林、AdaBoost、XGBoost和LightGBM高出1.9%、4.9%、4.3%和3.0%。
本文的其余部分安排如下:第2节介绍项目并分析收集的数据。第3节介绍特征提取方法和权重自适应随机森林算法。第4节验证了所提方法的有效性和优越性。第5节给出结论。

项目描述

项目描述

朝河至细辽河输水工程是一个大型项目,旨在将朝河的水引入细辽河,为沿线城市和工业园区供水。隧道#2的长度为58.505公里,从K10+300到K68+805。隧道#2的布局如图1所示,主要使用两台开式TBM施工(如图2所示),直径为5.2米。TBM的主要技术参数见表1。

数据预处理

数据预处理主要包括参数选择、异常值处理和数据归一化。第2.2节表明,推力、扭矩、掘进速度、切割头旋转速度等与围岩等级密切相关。著名的科罗拉多矿业学院(CSM)模型(Rostami,1997年)也可以从理论上解释为什么推力、扭矩、掘进速度和切割头旋转速度与围岩等级相关。CSM模型指出,正常力和滚动力

数据集构建

训练集使用来自第6批的数据构建。第6批中II、III、IV和V等级围岩对应的循环数分别为1122、3497、1012和788。III等级围岩的循环数进行了降采样,即随机选择了1000个掘进循环。由于第3、4和5批中没有包含所有四种围岩等级,因此从第3、4和5批的某些区域提取了40个循环来构建验证集,另外提取了160个循环

结论

本研究提出了一种基于滑动窗口特征提取和WA-RF的方法,可以从掘进参数的变化中提取地质信息,并考虑类别权重对模型性能的影响。该方法主要包括两部分:一部分是预处理原始数据并提出一种基于滑动窗口的方法从掘进参数的变化中提取特征;另一部分是改进随机森林算法以考虑类别权重的影响

未引用参考文献

中华人民共和国国家标准编制组(2009年)。

CRediT作者贡献声明

余洪刚:概念化、方法论、撰写——初稿、撰写——审阅与编辑、资源管理、数据整理、验证。徐树展:数据整理、可视化、验证、撰写——审阅与编辑。尹欣:方法论、撰写——审阅与编辑、验证、监督。马赫迪·哈桑尼帕纳:撰写——审阅与编辑、可视化、验证。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了中国博士后科学基金会(项目编号2023M742714、2025M783310和2023TQ0251)、国家自然科学基金(项目编号42507232和42177140)、山区土木工程安全与韧性国家重点实验室基金(项目编号SQQZ2025137)以及中央高校基本科研业务费(项目编号2042022KF1053)的支持。感谢中国水电六局有限公司和中国岩石力学与岩土工程学会的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号