会议专题

基于分类的中文微博热点话题发现方法研究

智能手机和微博客户端强化了微博的媒体特性,实时发现微博话题具有现实意义.文章提出了一种基于关键字分类的中文微博热点话题发现方法,通过关键字对微博信息进行筛选和归类,以时间窗内词频和增长速度构造赋权函数提取主题词,词汇的同文本条件概率作为相似度判定依据,基于改进的单遍聚类算法进行主题词聚类.对系统运行结果分析表明,该方法可以实时有效地聚类发现微博热点话题.

中文微博热点话题 发现方法 分类管理 系统架构

郑飞 张蕾

上海市公安局,上海 200025

国内会议

第29次全国计算机安全学术交流会

长春

中文

127-131

2014-09-12(万方平台首次上网日期,不代表论文的发表时间)