会议专题

热点事件发现

每年都会有一些机构通过媒体发布当年的热点事件,这些事件通常都是由人工进行筛选。本文提出一种方法来自动地发现热点事件。使用从新闻网站上下载下来的2006年的网页内容,通过增量聚类得到每月的临时事件。再将各个月临时事件列表里文档数大于一定阈值的事件,做单连通聚类,得到一年的事件列表。本文提出了一种事件热度打分方案,根据事件的热度对事件过滤和排序,最终获得一年的热点事件。

事件发现 增量聚类 热点事件 新闻网站 网页内容

龚海军 何婷婷 瞿国忠 张勇 胡文敏

华中师范大学计算机科学系 武汉 430049 国家语言资源监测与研究中心网络媒体分中心 武汉 430049

国内会议

第九届全国计算语言学学术会议

大连

中文

576-581

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)