会议专题

基于离群点剔除的网络热点事件挖掘算法

研究网络热点事件准确检测问题,收集网络文本数据中含有大量的离群点,由于离群点一些噪声数据,对网络热点事件检测产生不利影响.为提高检测正确率,提出一种采用离群点剔除的网络热点事件挖掘算法.首先通过计算数据点的密度相似度,将小于阈值的离群点剔除,降低计算复杂度和离群点的不利影响,然后采用模糊C均值聚类算法对网络文本进行聚类,发现其中的热点事件,最后通过仿真测试算法的有效性.仿真结果表明,改进算法剔除网络中的离群点,不仅提高了网络热点事件检测正确率,而且降低算法计算复杂度,加快了网络热点事件挖掘速度,更加适合于网络热点事件在线挖掘要求.

网络热点事件 挖掘算法 离群点剔除 仿真分析

王跟成 李军

西藏民族学院网络信息技术中心,陕西咸阳712082 成都理工大学信息科学与技术学院,四川成都610059

国内会议

中国计算机用户协会仿真应用分会成立三十周年庆祝大会暨2013全国仿真技术学术会议

呼和浩特

中文

290-293

2013-09-01(万方平台首次上网日期,不代表论文的发表时间)