一种基于短文本的独立语义特征抽取算法

摘要：

短文本广泛存在于人们的生产和生活中,有很大的研究价值,其主要特点就是短小性和多样性。本文提出了一种基于短文本的独立语义特征抽取算法,旨在降低文本向量的稀疏性并提高语义表示性。本文提出的算法首先采用潜在语义分析降低文本的维数并去除噪声,然后运用独立成份分析方法在潜在语义特征中提取出最能表达语义且相互统计独立的特征。实验证明本文提出的算法优于潜在语义索引算法。

关键词：短文本独立语义特征抽取算法文本向量语义分析

作者: 胡佳妮郭军徐蔚然

作者单位: 北京邮电大学信息工程学院,北京,100876

会议类型: 国内会议

会议名称: 2007年全国网络与信息安全技术研讨会

会议地点: 青岛

会议语种:中文

页码: 332-337

在线出版日期: 2007-07-18（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种基于短文本的独立语义特征抽取算法