会议专题

基于HNC语境理论的文本分类

本文用HNC语境理论来分析现在中文信息处理的一个热门话题--中文文本分类.HNC理论认为只有深入到语境层面,理解语句及篇章,才能更好的完成文本分类的工作。本文介绍了一种新的文本语义形式化模型--语境框架.语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态范畴)、背景(褒贬、参照等)三个框架.并在语境框架的基础上,设计实现了文本特征提取算法。

HNC语境 语境框架 中文文本分类 文本特征 提取算法

王文峰 唐兴全

北京大正语言知识处理研究院,北京,100081 对外经济贸易大学中文系,北京,100029

国内会议

第七届中文信息处理国际会议

武汉

中文

488-492

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)