基于标引信息的网络新概念发现算法
网络新概念的发现和识别是信息安全领域的一个基础技术,它可以网络热点信息挖掘等应用提供底层支持。通过合理地利用标引信息,算法在速度上可以满足网络海量信息的要求;为了提高新概念发现的准确率,算法不但采用了传统的分词、串频统计技术,而且还采用了字偏旁部首自动组合、网站间串频同现等新技术。实验证明,算法识别的潜在新概念中可接受率大于75%,完全可以满足当前信息安全领域的应用需求。
信息安全 网络新概念 挖掘算法 串频统计技术
邓攀 刘功申
上海交通大学信息安全学院,上海 200230
国内会议
青岛
中文
276-280
2007-07-18(万方平台首次上网日期,不代表论文的发表时间)