基于word-hashing的DGA僵尸网络深度检测模型
针对使用域名生成算法(DGA)僵尸网络隐蔽性强,传统检测算法特征提取复杂的问题,提出一种无需提取具体特征的深度学习模型DGA域名检测方法.首先基于word-hashing将所有域名转用二元语法字符串表示,利用词袋模型把域名映射到高维向量空间.然后利用5层深度神经网络对转换为高维向量的域名进行训练分类检测.通过深度模型,能够从训练数据中发现不同层次抽象的隐藏模式和特征,而这些模式和特征使用传统的统计方法大多是无法发现的.实验中使用了10万条DGA域名和10万条合法域名作为样本,与基于自然语言特征分类算法进行对比实验.实验结果表明该深度模型对DGA域名检测准确率达到97.23%,比基于自然语言特征分类算法得到的检测准确率高3.7%.
僵尸网络 域名生成算法 深度检测 深度学习
赵科军 葛连升 秦丰林 洪晓光
山东大学信息化工作办公室,济南250100;山东大学计算机科学与技术学院,济南250100 山东大学信息化工作办公室,济南250100 山东大学计算机科学与技术学院,济南250100
国内会议
济南
中文
30-33
2017-11-19(万方平台首次上网日期,不代表论文的发表时间)