从评估到集成:基于集成机器学习的混合特征选择框架在入侵检测中的应用

【字体: 时间:2026年02月13日 来源:IEEE Transactions on Dependable and Secure Computing 7.5

编辑推荐:

  特征选择方法在流量基入侵检测中的应用研究。提出融合互信息、随机森林和XGBoost重要性的确定性混合方法,通过单纯形搜索优化阈值选择。实验表明该方法在减少特征数量(78→31)的同时提升吞吐量9-10%,降低p50和p99延迟至0.40ms和1.20ms,误报率下降15-19%。相较于PSO/GA混合方法,在保持宏观F1分数的同时实现更优的误报率控制。构建对抗鲁棒性FGSM威胁模型,并设计轻量级跨数据集偏移缓解方案。

  

摘要:

我们研究了基于流的入侵检测中的特征选择(FS)方法,并提出了一种确定性的混合FS算法,该算法结合了互信息(MI)、随机森林(Random-Forest)和XGBoost的重要性评估方法,通过单阈值简单搜索进行优化。利用CIC-IDS-2017、CSE-CIC-IDS2018和NF-UNSW-NB15数据集,在安全防护协议下评估了十种特征选择技术与六种集成方法的性能。结果表明,这种混合FS算法在减少特征数量(例如从78个特征减少到31个特征)的同时,性能始终优于或至少与最佳的单个特征选择方法相当,并且运行时间也有所缩短。吞吐量提高了约9–10%,每个流的延迟从0.44毫秒(50%置信水平)降至0.40毫秒,以及1.40毫秒(99%置信水平)。平均95%的置信区间下,该算法的误报率(FPR)降低了15–19%,在每小时处理10万个流量的情况下,每小时虚假警报数量减少了22次。与代表性的PSO/GA混合算法相比,我们的算法在相似的延迟下实现了小幅但稳定的宏观F1分数提升以及15–25%的FPR降低。我们通过明确的FGSM特征空间威胁模型和DeepPackGen配置验证了算法的对抗鲁棒性,并通过轻量级措施发现了跨数据集的偏差问题。24小时的安全操作中心(SOC)回放显示,该算法在提高分析师工作效率(每天节省2.5–3.7小时)的同时,没有牺牲宏观F1分数或平均精确度(AUROC)。研究结果表明,确定性、紧凑型的特征选择算法是适用于实时入侵检测(IDS)的实用选择,特别是在关注尾部延迟和警报数量的情况下。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号