基于语言概念空间特征的作者写作风格分类研究
文本分类是文本信息自动处理的重要研究领域,文本作者风格的识别处理可以作为一类特殊的文本分类处理。针对自然语言表层信息特征的数据稀疏缺陷,引入了HNC的概念基元表述体系作为特征载体,以KNN算法作为基础,进行了汉语文本作者的识别处理研究。实验数据表明,本处理模式达到了较高的成功率,具有可行性。
信息处理 文本分类 语言概念空间 文本作者风格 识别模式
张运良 张全 朱礼军 乔晓东
中国科学技术信息研究所,北京,100038 中国科学院声学研究所,北京,100080
国内会议
银川
中文
323-328
2007-09-01(万方平台首次上网日期,不代表论文的发表时间)