会议专题

汉语主客观文本分类特征的研究

在意见挖掘中所处理的文本是主观性文本,这就涉及到主客观文本的分类问题。本文首先介绍了主客观文本的定义。接着针对主观性文本的特点提出了分类适用的预选特征。在此基础上,介绍了通过实验选择稳定的分类特征并把它们应用于Weka工具的四种分类算法中。实验结果表明:四种分类算法的F度量最高时可以达到93.8%,平均F度量也达到了88.4%。这说明我们提出的分类特征是合理和有效的。

汉语 主观性文本 文本分类 意见挖掘 分类算法

姚天昉 彭思崴

上海交通大学计算机科学与工程系 上海 200240

国内会议

第五届全国数字博物馆与文化自然遗产数字化及保护研讨会

苏州

中文

176-178,182

2007-12-07(万方平台首次上网日期,不代表论文的发表时间)