一种基于短文本的独立语义特征抽取算法
短文本广泛存在于人们的生产和生活中,有很大的研究价值,其主要特点就是短小性和多样性。本文提出了一种基于短文本的独立语义特征抽取算法,旨在降低文本向量的稀疏性并提高语义表示性。本文提出的算法首先采用潜在语义分析降低文本的维数并去除噪声,然后运用独立成份分析方法在潜在语义特征中提取出最能表达语义且相互统计独立的特征。实验证明本文提出的算法优于潜在语义索引算法。
短文本 独立语义 特征抽取算法 文本向量 语义分析
胡佳妮 郭军 徐蔚然
北京邮电大学信息工程学院,北京,100876
国内会议
青岛
中文
332-337
2007-07-18(万方平台首次上网日期,不代表论文的发表时间)