一种基于词汇的文本语义倾向向量空间模型表示算法
文本语义倾向识别是指识别某一特定主题的文本所具有的主观态度倾向性。本文基于词汇本身的语义倾向信息,提出了一种基于词汇的向量空间模型(VSM)表示算法。该算法综合利用文本的语法、语义、语用三个层次,结合了统计和规则的方法,融合了一般领域与特定领域的信息。实验表明,与多种传统机器学习算法相比,该算法更加能够对文本的语义以及语用层信息加以表达,并能很好地处理网络中噪声较大的文本,且具有较好的鲁棒性,并能在结合C4.5决策树算法时达到90.79%的性能。
自然语言 语言处理 语义识别 机器学习
张锦明 王小捷 张岩 吴云
北京邮电大学信息工程学院 100876
国内会议
哈尔滨
中文
866-872
2007-11-20(万方平台首次上网日期,不代表论文的发表时间)