会议专题

基于LDA分析的词聚类算法

本文提出一种新的基于LDA分析的词聚类算法,生成基于类的语言模型,利用LDA(Latent Dirichlet Allocation)分析词在不同主题上的分布,得到词的特征向量,对其进行k均值聚类。由于这种聚类方法融入了文本语义信息,使得聚类的结果因注入了上下文的信息而更加实用化。

语言模型 LDA分析 词聚类 特征向量 k均值聚类

楚彦凌 刘刚

北京邮电大学 信息与通信学院,北京 100876

国内会议

第十届全国人机语音通讯学术会议

乌鲁木齐

中文

96-100

2009-08-14(万方平台首次上网日期,不代表论文的发表时间)