会议专题

利用语言概念表示的作者写作风格分类研究

文本分类是文本信息自动处理的重要研究领域,文本作者风格的识别处理可以作为一类特殊的文本分类处理。本文针对自然语言表层信息特征的数据稀疏缺陷,引入了HNC的概念基元表述体系作为特征载体,以KNN算法作为基础,进行了汉语文本作者的识别处理研究。实验数据表明,本文的处理模式达到了较高的成功率,具有可行性。

语言概念空间 HNC理论 汉语文本分类 KNN算法 作者写作风格 处理模式

张全 张运良 袁毅

中国科学院声学研究所,北京,100080 中国科学技术信息研究所,北京,100038;中国科学院声学研究所,北京,100080

国内会议

第七届中文信息处理国际会议

武汉

中文

460-464

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)