自然语言中的对象及其处理
自然语言处理(Natural Language Processing,简称NLP)研究的核心问题就足为机器构造自然语言的语言模型,由于自然语言的非结构化和开放性的特点,传统的规则型语言模型和基于统计的语言模型很难单独解决NLP中面临的问题。本文从对象的视角为自然语言建立语言模型,主要思想是:对自然语言中的字、词、句、篇章和文档等看成是粒度不同的对象类,并根据基本的语法规则总结得到这些对象类的基本属性特征,而每个特定对象则基于语料库用统计(法)统计其在上下文中特定的使用方法并作为该对象的扩展特征,这样可以将规则方法和统计方法较好的结合起来,并用统一的方法对各类对象进行分析处理,试图为NLP提供一种新的解决方案。
语言模型 规则方法 统计方法 语言对象
钟茂生
华东交通大学信息工程学院,南昌330013;上海交通大学计算机科学与工程系,上海 200240
国内会议
苏州
中文
405-412
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)