入侵检测大数据集代价敏感重平衡分类策略
当前数据挖掘领域中,传统的精度敏感分类并不能完全适用于不平衡入侵检测数据。文中针对大规模不平衡入侵检测数据集,定义数据拓展函数,提出了一种新的大规模数据分层预处理LDSP(Large Scale Dataset Stratified Pretreatment)算法,分层并人工合成稀有类数据”剪除”多数类数据重平衡数据集,不仅有效避免了数据过度拟合且可独立使用。结合入侵检测代价敏感分配机制,最小化误分类代价,最终实现了LDSP算法与MetaCost算法相结合的数据重平衡分类策略。实验结果表明,预处理算法合理有效;较之其他算法,此策略在时间和精度上均具有处理入侵检测大规模不平衡数据集分类问题的优势。
重平衡 数据预处理 代价敏感 入侵检测
边婧 彭新光 闫建红
太原理工大学计算机科学与技术学院,太原030024 山西职工医学院网络信息中心,太原030012 太原理工大学计算机科学与技术学院,太原030024 太原师范学院计算机科学与技术系,太原030012
国内会议
大连
中文
1-1
2012-10-01(万方平台首次上网日期,不代表论文的发表时间)