会议专题

基于CAAR算法的文本倾向性分析技术

针对同一主题下的相关评论,本文提出了一种分析文本倾向性的方法——CAAR算法.首先,利用网络爬虫采集相关语料并分析整理,获得同一主题下相关评论的语料;其次,对语料中的评论文本采用基于语义的方法一一改进的SBV极性算法,计算评论文本的倾向性,并对其进行分级,获取评论文本可信度;最后,利用评论文本可信度及关联度对评论文本的倾向性进行分析调整,最终获取评论文本的倾向性.本文通过大量相关语料进行测试,CAAR算法与改进的SBV极性算法相比,F1值提高了3%~5%,表明该算法能够有效地分析同一主题下相关评论文本倾向性.

评论文本 倾向性分析技术 语料采集 CAAR算法

单大甫 周斌 黄九鸣

国防科学技术大学计算机学院 长沙 410073

国内会议

第25次全国计算机安全学术交流会

杭州

中文

147-152

2010-09-17(万方平台首次上网日期,不代表论文的发表时间)