基于时间序列分析的微博突发话题检测方法
针对微博信息噪音大、新颖度难以判断的问题,在动量模型的基础上进行优化,提出了基于时序分析的微博突发话题检测方法.通过动量模型提取候选突发特征后,对特征的动量时间序列分别借鉴信号频域分析理论和股票趋势分析理论进行建模,分析特征的频域特性来识别频繁伪突发特征,分析特征的新颖程度来识别间歇性伪突发特征,合并过滤后的有效突发特征形成突发话题.微博数据实验表明,该方法有效提高了突发话题检测的准确率和F值.
微博 突发话题 检测方法 时序分析 频域特性
贺敏 徐杰 杜攀 程学旗 王丽宏
中国科学院计算技术研究所,北京 100080;国家计算机网络应急技术处理协调中心,北京 100029 国家计算机网络应急技术处理协调中心,北京 100029 中国科学院计算技术研究所,北京 100080
国内会议
武汉
中文
386-392
2015-05-26(万方平台首次上网日期,不代表论文的发表时间)