会议专题

中文褒贬义词语倾向性的分析

倾向性语言是观点表达的重要形式,识别出文本中的倾向性语言是挖掘文本中观点信息的关键工作之一.本文分析了褒贬义词语在句子中所起的主观作用,旨在以此判定文本句子中是否带有倾向性.本文认为褒贬义词语在句中所起的作用应该由词语在句中位置和自身意义共同决定.为了证明这两点我们首先对语料库进行了统计和分析,然后分别从这两方面分析了词语在句子中表现的倾向性:一方面在同时考虑倾向性强弱和极性的测度下,提出用极坐标来表示一个词语的倾向性,并使用一种均衡化互信息的方法,探讨了词语在统计意义下,独立于具体上下文体现出的自身倾向性;另一方面以包含上下文的2000形容词标注语料为例,使用最大熵方法测试了30个上下文特征的对词语倾向性的作用.最后给出了评测的方法和结果.

词语主观性 词语倾向性 观点分析 褒贬义

王根 赵军

中科院自动化研究所模式识别国家重点实验室,北京,100080

国内会议

第三届学术计算语言学研讨会

沈阳

中文

81-85

2006-08-15(万方平台首次上网日期,不代表论文的发表时间)