会议专题

漏洞数据库的K均值和DBSCAN聚类比较

  本文对中国国家漏洞数据库的漏洞数据进行不同方法的聚类分析,并比较分析结果,得出潜在的可靠的划分方法。数据预处理,找出合适的漏洞数据字段,去掉描述性不强或不完整的字段,提取漏洞描述文本并进行分词。对预处理结果进行距离度量,然后依次进行基于划分的K均值算法聚类和基于密度的DBSCAN算法聚类,评估比较聚类结果,找出潜在漏洞划分方法,并比较两种聚类方法的优点与缺点。

漏洞数据库 信息漏洞 K均值算法 聚类分析 数据挖掘

杨振宇 陈柯 熊琦

中国国家信息安全测评中心,北京

国内会议

第四届信息安全漏洞分析与风险评估大会

北京

中文

54-60

2011-10-01(万方平台首次上网日期,不代表论文的发表时间)