会议专题

基于最大熵模型的组块分析.

本文采用最大熵模型实现中文组块分析的任务.首先我们明确了中文组块的定义,并且列出了模型中所有的组块类型和组块标注符号.组块划分和识别的过程可以转化为对于每一个词语赋予一个组块符号标注的过程,我们可以它作为一个分类问题根据最大熵模型来解决.最大熵模型的关键是如何选取有效的特征特征,文中给出了相关的特征选择过程和算法.最后给出了系统实现和实验结果.

组块分析 语法分析 最大熵原理 浅层分析

李素建 刘群 杨志峰

中国科学院,计算技术研究所,北京,100080

国内会议

中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会

四川广元

中文

113-120

2002-07-13(万方平台首次上网日期,不代表论文的发表时间)