从评估到集成：基于集成机器学习的混合特征选择框架在入侵检测中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年02月13日 来源：IEEE Transactions on Dependable and Secure Computing 7.5

编辑推荐：

　　特征选择方法在流量基入侵检测中的应用研究。提出融合互信息、随机森林和XGBoost重要性的确定性混合方法，通过单纯形搜索优化阈值选择。实验表明该方法在减少特征数量（78→31）的同时提升吞吐量9-10%，降低p50和p99延迟至0.40ms和1.20ms，误报率下降15-19%。相较于PSO/GA混合方法，在保持宏观F1分数的同时实现更优的误报率控制。构建对抗鲁棒性FGSM威胁模型，并设计轻量级跨数据集偏移缓解方案。

摘要：

我们研究了基于流的入侵检测中的特征选择（FS）方法，并提出了一种确定性的混合FS算法，该算法结合了互信息（MI）、随机森林（Random-Forest）和XGBoost的重要性评估方法，通过单阈值简单搜索进行优化。利用CIC-IDS-2017、CSE-CIC-IDS2018和NF-UNSW-NB15数据集，在安全防护协议下评估了十种特征选择技术与六种集成方法的性能。结果表明，这种混合FS算法在减少特征数量（例如从78个特征减少到31个特征）的同时，性能始终优于或至少与最佳的单个特征选择方法相当，并且运行时间也有所缩短。吞吐量提高了约9–10%，每个流的延迟从0.44毫秒（50%置信水平）降至0.40毫秒，以及1.40毫秒（99%置信水平）。平均95%的置信区间下，该算法的误报率（FPR）降低了15–19%，在每小时处理10万个流量的情况下，每小时虚假警报数量减少了22次。与代表性的PSO/GA混合算法相比，我们的算法在相似的延迟下实现了小幅但稳定的宏观F1分数提升以及15–25%的FPR降低。我们通过明确的FGSM特征空间威胁模型和DeepPackGen配置验证了算法的对抗鲁棒性，并通过轻量级措施发现了跨数据集的偏差问题。24小时的安全操作中心（SOC）回放显示，该算法在提高分析师工作效率（每天节省2.5–3.7小时）的同时，没有牺牲宏观F1分数或平均精确度（AUROC）。研究结果表明，确定性、紧凑型的特征选择算法是适用于实时入侵检测（IDS）的实用选择，特别是在关注尾部延迟和警报数量的情况下。

联系信箱：

粤ICP备09063491号

摘要：

热点排行