基于迁移学习的跨坡度风压建模框架：缓解数据稀缺性的创新方法

《Results in Engineering》：A transfer-learning framework to alleviate data scarcity in cross-slope wind pressure modeling

【字体：大中小】 时间：2026年02月02日 来源：Results in Engineering 7.9

编辑推荐：

　　本研究针对低层建筑屋面风压预测中数据稀缺和不同屋面坡度条件缺乏系统性研究的难题，提出并验证了一种基于迁移学习的集成学习建模框架。研究人员以3:12坡度数据为源域预训练CatBoost等模型，并利用少量1:12坡度目标域数据微调，成功实现了跨坡度风压系数（Cpmean、CpRMS、Cpmax、Cpmin）的高精度预测，相对误差多数低于10%。通过SHAP可解释性分析揭示了特征贡献机制，为工程数字孪生应用提供了数据高效、物理可解释的解决方案，发表于《Results in Engineering》。

在全球快速城市化与极端风事件频发的背景下，低层建筑屋面的风压预测已成为风工程研究的热点问题。然而，当前缺乏能够系统考虑不同屋面坡度条件的可扩展预测方法。传统风洞试验和数值模拟成本高、耗时长，难以满足工程实践中性能化设计、数字化运维和快速决策的需求。尤其对于低层建筑，屋面坡度变化会显著改变建筑周围的气流行为，导致复杂的流场演化，而获取足够的高质量实测数据又极具挑战性。这种数据稀缺性问题严重制约了数据驱动模型在风压预测中的应用。

为了在预测精度与工程适用性之间取得最佳平衡，研究人员在《Results in Engineering》上发表了最新研究成果。该研究创新性地提出了一个结合迁移学习与集成学习的框架，旨在解决跨坡度风压建模中的数据稀缺问题。研究团队设想，能否利用一个坡度（源域）上相对丰富的数据训练出的模型知识，迁移到另一个坡度（目标域）上，即使用少量目标域数据也能实现准确的风压预测？为了验证这一设想，他们开展了一项系统性的研究。

研究人员选用了屋面坡度分别为3:12（源域）和1:12（目标域）的低层建筑作为研究对象，数据来源于NIST-UWO空气动力学数据库。该数据库包含了建筑表面大量测点的风压系数时间序列。输入变量包括测点的归一化坐标（x/X, y/Y）、屋面坐标z和风向角α，输出变量为平均风压系数Cp_mean和均方根风压系数Cp_RMS。

为开展研究，团队主要应用了几项关键技术方法：首先，系统比较了四种集成学习算法（随机森林RF、XGBoost、LightGBM和CatBoost）在源域的预测性能，并采用贝叶斯优化进行五折交叉验证以确定最佳超参数；其次，构建了迁移学习框架，即在源域（3:12坡度）预训练模型，然后仅使用目标域（1:12坡度）30%的数据对最优模型（CatBoost）进行微调，并在目标域四个独立风向（280°, 300°, 320°, 340°）上验证其迁移效能；第三，开发了一种新颖的两级CatBoost模型，利用预测的Cp_mean和Cp_RMS作为输入特征，进一步精准预测峰值风压系数（Cp_max和Cp_min）；最后，引入SHapley可加性解释（SHAP）进行全局和实例级别的可解释性分析，以揭示复杂的特征交互作用和潜在的物理机制。模型性能采用决定系数R2、均方根误差RMSE、平均绝对误差MAE、平均绝对百分比误差MAPE和相对均方根误差RRMSE等指标进行综合评价。

5.1. 超参数优化

研究首先在源域数据集上对四种集成学习模型进行了超参数优化。结果表明，CatBoost模型在预测Cp_mean和Cp_RMS时，均能在较少的迭代次数内达到稳定，并取得最低的RMSE值，显示出其优异的性能和收敛速度。

5.2. 集成学习模型对比分析

通过对四种模型在训练集和测试集上的全面评估，发现所有模型均表现出良好的拟合优度（R2 > 0.97）。其中，CatBoost模型在预测Cp_mean和Cp_RMS方面均表现最佳，其测试集R2分别达到0.9938和0.9913，MAE分别为0.0067和0.0076，且其预测的不确定性（通过bootstrap法计算的变异系数COV）最低，平均COV值低于5%的样本比例最高，证明了其最优的预测精度和稳健性。模型性能排序为：CatBoost > LightGBM > XGBoost > RF。

5.3. 风压预测的迁移学习

将源域（3:12坡度）预训练好的模型，使用目标域（1:12坡度）30%的数据进行微调后，模型在目标域四个独立验证案例上的预测性能得到显著提升。以最优的CatBoost模型为例，微调后其预测Cp_mean和Cp_RMS的R2分别从微调前的0.6165和0.7298大幅提升至0.9710和0.9614，MAPE分别从26.84%和27.40%降至10.29%和9.65%。误差云图分析显示，绝大多数测点的相对误差低于10%，即使在流动分离复杂的角部区域，多数测点误差也控制在20%以内。这充分验证了所提迁移学习框架在数据稀缺条件下有效提升预测性能的能力。

5.4. 验证案例上迁移学习的误差分析

对目标域四个未参与训练的风向角进行详细误差分析表明，微调后的CatBoost模型预测值与实验值吻合良好。特别是在流动复杂的屋角区域，模型也能较好地捕捉风压分布特征。误差随实际风压系数增大而减小的趋势，与流体力学中高风速区域流动相对稳定的物理规律一致。

5.5. 使用基于两级CatBoost迁移学习进行峰值风压预测

研究提出了一个两级CatBoost预测框架用于峰值风压系数预测。第一级模型预测Cp_mean和Cp_RMS，第二级模型将这些预测值连同原始特征一同输入，用于预测Cp_max和Cp_min。在源域，该模型对Cp_max和Cp_min的预测R2分别达到0.9571和0.9586。迁移学习后，在目标域验证案例上，微调后的两级模型性能显著优于未微调的源模型，R2分别从0.4218和0.8841提升至0.9204和0.9453，表明该框架能够有效捕捉峰值风压与均值、脉动风压之间的复杂非线性关系。

6. 所开发模型的可解释性分析

通过SHAP分析，研究从全局和局部层面解释了模型的决策机制。全局重要性分析表明，归一化的横向坐标y/Y是影响Cp_mean和Cp_RMS的最重要特征，其对Cp_mean呈负贡献，对Cp_RMS呈正贡献，这与屋角区域分离流强烈、风压波动剧烈的物理现象一致。在迁移学习后， fine-tuned CatBoost模型在目标域中保持了y/Y的核心重要性，但屋面高度z的贡献度显著降低，反映了较缓坡度（1:12）屋面流动对高度变化不敏感的特性，说明了模型能够自适应目标域的物理特征。实例解释性分析进一步验证了模型在不同位置测点预测结果的物理合理性。

7. 结论

该研究成功开发并验证了一个基于迁移学习和集成学习的低层建筑屋面风压预测框架。研究表明，CatBoost模型在源域风压预测中表现最优。迁移学习策略能够利用少量目标域数据，显著提升模型在新坡度条件下的预测精度和泛化能力。提出的两级CatBoost框架能够高精度预测峰值风压系数。SHAP可解释性分析揭示了特征之间的复杂相互作用，增强了模型的可信度和物理一致性。该研究为解决风工程中数据稀缺问题提供了有效的、可解释的且工程适用的方法，为支持屋盖系统可靠性评估和数字孪生应用中的实时决策提供了可行的技术路径。这项工作展示了跨坡度知识迁移与微调策略在数据不足条件下增强风压预测的有效性，为风工程的智能化设计与管理提供了新思路。

热点排行