会议专题

兼类词排歧的一种方法

词性标注的关键是兼类词的排歧.本文探讨了一种方法来解决兼类问题,并以动词中的兼类词为切入点做了实验,即利用非兼类动词(纯动词)在大规模语料中的分布信息来判断具体上下文中出现的某个与动词有关的兼类词的词性.这种方法不需要人工标注好词性的训练语料,所需知识仅停留在词表一级,而且对其他存在兼类现象的语言也同样适用.实验结果证明了该方法的可行性.

兼类词排歧 纯动词 计算语言学 汉语语料库 自然语言处理

王洁 荀恩东 宋柔

北京语言大学语言信息处理研究所(北京)

国内会议

第二届全国学生计算语言学研讨会

北京

中文

134-138

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)