汉语主客观文本分类特征的研究
在意见挖掘中所处理的文本是主观性文本,这就涉及到主客观文本的分类问题。本文首先介绍了主客观文本的定义。接着针对主观性文本的特点提出了分类适用的预选特征。在此基础上,介绍了通过实验选择稳定的分类特征并把它们应用于Weka工具的四种分类算法中。实验结果表明:四种分类算法的F度量最高时可以达到93.8%,平均F度量也达到了88.4%。这说明我们提出的分类特征是合理和有效的。
汉语 主观性文本 文本分类 意见挖掘 分类算法
姚天昉 彭思崴
上海交通大学计算机科学与工程系 上海 200240
国内会议
苏州
中文
176-178,182
2007-12-07(万方平台首次上网日期,不代表论文的发表时间)