面向微博的中文反语识别研究

摘要：

反语通常又称为”说反话”，其字面意思和所要表达的意思相反，是一种带有强烈情感色彩的修辞手法。和自然会话相比，社交网络上的语言表达虽然缺少一些语气或肢体行为等辅助手段，在此基础上，通过信息增益方法对比了各特征对反语识别的影响程度。此外，还实验验证了在该特征体系下不同分类器的分类性能及稳定性。本文主要研究中文微博中反语识别的可计算化问题。在考虑中文语言特性和微博语言表达特性的基础上，构建了基于一元文法的词汇特征、中文特有的谐音词、连续标点符号、微博长度、动词被动化和双引号内外情感模糊等六种特征，并实验验证了该特征体系在识别反语中的有效性和稳定性。

关键词：中文语料反语识别标点符号谐音词动词被动化文本情感模糊度

作者: 邓钊贾修一陈家骏

作者单位: 南京理工大学计算机科学与工程学院,江苏南京210094 南京大学计算机科学与技术系,江苏南京210023

会议类型: 国内会议

会议名称: 中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

会议地点: 广州

会议语种:中文

页码: 1-9

在线出版日期: 2015-11-13（万方平台首次上网日期，不代表论文的发表时间）

会议专题

面向微博的中文反语识别研究