会议专题

结合表示学习和迁移学习的跨领域情感分类

  针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息,且在迁移过程中存在负面迁移的问题,提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法.该方法首先利用低维稠密的词向量对文本进行初始化,通过分层注意力网络对文本中重要单词与句子的情感信息进行建模,从而学习源领域与目标领域的文档级分布式表示.随后采用类噪声估计方法,对源领域中的迁移数据进行检测,剔除负面迁移样例,挑选高质量样例以扩充目标领域的训练集.最后训练支持向量机对目标领域文本进行情感分类.在大规模公开数据集上进行的两个实验结果表明,与基准方法相比,该方法在均方根误差上分别降低了1.5%和1.0%,说明该方法可以有效提高跨领域情感分类性能.

文本表示学习 迁移学习 类噪声估计 跨领域 情感分类

廖祥文 吴晓静 桂林 黄锦辉 陈国龙

福州大学数学与计算机科学学院,福州 350116;福建省网络计算与智能信息处理重点实验室(福州大学),福州 350116;福建省信息处理与智能控制重点实验室(闽江学院),福州 350116 福州大学数学与计算机科学学院,福州 350116;福建省网络计算与智能信息处理重点实验室(福州大学),福州 350116 福州大学数学与计算机科学学院,福州 350116 香港中文大学系统工程与工程管理学系,香港

国际会议

2018自然语言处理与中文计算国际会议(NLPCC2018)

呼和浩特

中文

1-10

2018-08-26(万方平台首次上网日期,不代表论文的发表时间)