基于分类的中文微博热点话题发现方法研究
智能手机和微博客户端强化了微博的媒体特性,实时发现微博话题具有现实意义.文章提出了一种基于关键字分类的中文微博热点话题发现方法,通过关键字对微博信息进行筛选和归类,以时间窗内词频和增长速度构造赋权函数提取主题词,词汇的同文本条件概率作为相似度判定依据,基于改进的单遍聚类算法进行主题词聚类.对系统运行结果分析表明,该方法可以实时有效地聚类发现微博热点话题.
中文微博热点话题 发现方法 分类管理 系统架构
郑飞 张蕾
上海市公安局,上海 200025
国内会议
长春
中文
127-131
2014-09-12(万方平台首次上网日期,不代表论文的发表时间)