会议专题

网络热点信息发现研究

网络信息的指数爆炸给人们获取与掌控信息带来了困扰,为了有效挖掘海量网络数据中的热点信息,本文设计了网络热点信息发现算法。该算法基于多级滤噪的切分词拼接,利用特定的噪音库与多级滤噪策略严格控制拼接过程,在合理收录策略的挑选下,算法提取出了能够准确反映海量网络数据中热门事件的热点信息串。在TDT国际标准评测语料上进行的实验中,该算法表现出令人满意的性能。

网络信息 热点发现算法 未登录词识别 切分词拼接

曾依灵 许洪波

中国科学院计算技术研究所智能安全中心,北京 100080;中国科学院研究生院,北京 100080 中国科学院计算技术研究所智能安全中心,北京 100080

国内会议

2007年全国网络与信息安全技术研讨会

青岛

中文

366-372

2007-07-18(万方平台首次上网日期,不代表论文的发表时间)