会议专题

面向汉语短文的话题识别系统研究

本文介绍了一个对来自多数据源的汉语短文进行话题识别的系统及其实现方法。从初步的模拟实验结果来看.该系统达到了预期的目标,系统中使用的词频统计方法和短文聚类方法是有效的。对系统的完善和进行实际环境中的完整测试还需要做大量的工作。短文的聚类问题仍是今后需要研究的重点。

汉语短文 话题识别 词频统计 聚类方法

王永恒 贾焰 杨树强

国防科技大学计算机学院网络研究所,长沙,410073

国内会议

第二十一届中国数据库学术会议

厦门

中文

333-336

2004-10-14(万方平台首次上网日期,不代表论文的发表时间)