会议专题

基于自动编码特征的汉语解释性意见句识别

提出一种基于自动编码特征的汉语解释性意见句识别的分类方法.首先从汽车和手机两个领域的产品评论中构造一个解释性意见语料库,然后采用分类的方法进行解释性意见句识别.特别地,采用自动编码技术表示和学习解释性意见句分类的词向量特征.最后,在支持向量机框架下通过实验优选解释性词向量维度,并与一些传统特征表示方法进行比较.实验结果表明,与传统的卡方、信息增益和TF-IDF及其组合方法相比,自动编码特征的引入能有效提升汉语解释性意见句识别性能。

解释性意见句 文字识别 自动编码技术 词向量特征

贺宇 潘达 付国宏

黑龙江大学计算机科学技术学院,哈尔滨150080

国内会议

第三届CCF国际自然语言处理与中文计算会议

深圳

中文

234-240

2014-12-05(万方平台首次上网日期,不代表论文的发表时间)