会议专题

面向微博的中文反语识别研究

反语通常又称为”说反话”,其字面意思和所要表达的意思相反,是一种带有强烈情感色彩的修辞手法。和自然会话相比,社交网络上的语言表达虽然缺少一些语气或肢体行为等辅助手段,在此基础上,通过信息增益方法对比了各特征对反语识别的影响程度。此外,还实验验证了在该特征体系下不同分类器的分类性能及稳定性。本文主要研究中文微博中反语识别的可计算化问题。在考虑中文语言特性和微博语言表达特性的基础上,构建了基于一元文法的词汇特征、中文特有的谐音词、连续标点符号、微博长度、动词被动化和双引号内外情感模糊等六种特征,并实验验证了该特征体系在识别反语中的有效性和稳定性。

中文语料 反语识别 标点符号 谐音词 动词被动化 文本情感模糊度

邓钊 贾修一 陈家骏

南京理工大学计算机科学与工程学院,江苏南京210094 南京大学计算机科学与技术系,江苏南京210023

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-9

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)