会议专题

主题聚类方法的探索与实践

  传统信息组织方法存在很多困境、一般文本挖掘方法存在高维数据计算并缺乏主题控制问题,这使得传统信息组织方法与机器自动学习方法的融合尤为必要。信息组织方法中的主题法与数据挖掘中的聚类方法的结合,使得主题聚类方法应运而生。主题提取是一项基础性的信息提取工作,主题聚类则是以主题提取为前提的信息聚类过程。本文简要描述了主题聚类的研究意义、基本原理、方法与步骤,重点对主题聚类中的主题抽取、基于主题的文本聚类与聚类描述等关键问题进行了描述,介绍了主题聚类方法的相关实践。最后对今后的主题聚类研究和应用方向进行展望。

主题聚类 信息组织 自动标引 文本聚类

章成志

南京理工大学信息管理系

国内会议

全国第五次情报检索语言发展方向研讨会

上海

中文

256-268

2009-06-01(万方平台首次上网日期,不代表论文的发表时间)