恶意代码聚类中的特征选取研究
近几年,随着恶意代码数量的飞速增长,将聚类算法用于恶意代码新家族检测受到越来越多安全厂商的青睐.恶意代码聚类将具有相似行为或结构的样本划分到同一簇中,选取不同的特征将影响恶意代码的聚类质量.文章首先选取恶意代码聚类研究中常用的特征进行讨论比较.现有大部分研究均选取单一特征向量进行聚类,而任何单一特征向量均难以完整描述恶意代码的全部性质.针对该问题,文章接着提出利用多特征向量对的方法进行恶意代码聚类,并根据聚类结果定义特定的指标对选用的特征进行评价.最后,文章结合DBSCAN聚类算法对各种特征以及特征间的组合进行实验,结果表明,采用多特征向量对的聚类效果要优于单一特征向量.
恶意代码 聚类算法 特征选取
王毅 唐勇 卢泽新 俞昕
国防科学技术大学计算机学院,湖南长沙 410073
国内会议
厦门
中文
64-68
2016-09-01(万方平台首次上网日期,不代表论文的发表时间)