会议专题

基于语言概念空间特征的作者写作风格分类研究

文本分类是文本信息自动处理的重要研究领域,文本作者风格的识别处理可以作为一类特殊的文本分类处理。针对自然语言表层信息特征的数据稀疏缺陷,引入了HNC的概念基元表述体系作为特征载体,以KNN算法作为基础,进行了汉语文本作者的识别处理研究。实验数据表明,本处理模式达到了较高的成功率,具有可行性。

信息处理 文本分类 语言概念空间 文本作者风格 识别模式

张运良 张全 朱礼军 乔晓东

中国科学技术信息研究所,北京,100038 中国科学院声学研究所,北京,100080

国内会议

第二十一届全国计算机信息管理学术研讨会

银川

中文

323-328

2007-09-01(万方平台首次上网日期,不代表论文的发表时间)