汉语主客观文本分类特征的研究

摘要：

在意见挖掘中所处理的文本是主观性文本,这就涉及到主客观文本的分类问题。本文首先介绍了主客观文本的定义。接着针对主观性文本的特点提出了分类适用的预选特征。在此基础上,介绍了通过实验选择稳定的分类特征并把它们应用于Weka工具的四种分类算法中。实验结果表明:四种分类算法的F度量最高时可以达到93.8％,平均F度量也达到了88.4％。这说明我们提出的分类特征是合理和有效的。

关键词：汉语主观性文本文本分类意见挖掘分类算法

作者: 姚天昉彭思崴

作者单位: 上海交通大学计算机科学与工程系上海 200240

会议类型: 国内会议

会议名称: 第五届全国数字博物馆与文化自然遗产数字化及保护研讨会

会议地点: 苏州

会议语种:中文

页码: 176-178,182

在线出版日期: 2007-12-07（万方平台首次上网日期，不代表论文的发表时间）

会议专题

汉语主客观文本分类特征的研究