面向变异短文本的快速聚类算法
本文研究了变异短文本的聚类技术,提出了一种快速准确的聚类算法,它在原有的去重算法基础上,针对变异短文本这一特殊情况,采取了特定的特征串抽取方法,并融合了压缩编码的思想,加快了处理速度。实验表明,基于该算法的聚类系统对于大量的变异短文本有着很高的执行效率和准确率。
信息检索 特征串抽取 变异短文本 聚类算法 压缩编码
黄永光 刘挺 车万翔 胡晓光
哈尔滨工业大学信息检索实验室,哈尔滨 150001
国内会议
北京
中文
114-120
2005-08-30(万方平台首次上网日期,不代表论文的发表时间)