一种基于情感符号的在线突发事件检测方法
如何快速高效检测出海量数据流中的突发事件是目前的研究热点之一.文中针对微博数据流,提出了一种新颖的基于情感符号的在线突发事件检测算法框架.伴随着事件的发生,文本流中情感符号也存在突发现象.文中通过实时监测情感符号变化态势,及时发现情感符号的突发期,达到挖掘突发事件的目的.首先基于频繁模式挖掘和互信息相结合的算法构建情感符号模型,并通过此模型抽取数据流中的情感符号,采用改进Kleinberg算法检测突发期,通过启发式的近邻传播聚类算法检测突发事件并对事件进行合并.同时,算法设置了离线回收机制,对不含情感符号的博文进行回收利用以保证事件概要抽取的完备性.实验表明,该算法可有效地挖掘出突发事件,无论在速度还是精度上都能保证实时在线处理的要求.
信息处理 在线突发事件 检测算法 情感符号
张鲁民 贾焰 周斌 赵金辉 洪锋
国防科学技术大学计算机学院 长沙 410073 西安卫星测控中心 西安 710043
国内会议
哈尔滨
中文
1659-1667
2013-08-16(万方平台首次上网日期,不代表论文的发表时间)