基于LDA分析的词聚类算法
本文提出一种新的基于LDA分析的词聚类算法,生成基于类的语言模型,利用LDA(Latent Dirichlet Allocation)分析词在不同主题上的分布,得到词的特征向量,对其进行k均值聚类。由于这种聚类方法融入了文本语义信息,使得聚类的结果因注入了上下文的信息而更加实用化。
语言模型 LDA分析 词聚类 特征向量 k均值聚类
楚彦凌 刘刚
北京邮电大学 信息与通信学院,北京 100876
国内会议
乌鲁木齐
中文
96-100
2009-08-14(万方平台首次上网日期,不代表论文的发表时间)