基于特征自动选取的汉语词义消歧

(0)

摘要：

自然语言处理的许多问题都可以归结为分类问题,汉语词义消歧是一类典型的分类问题。在分类问题中,特征的选择至关重要。通常情况下,特征的选择由人工直接确定，这样的选取方式,要求选取者对于分类问题本身和机器学习模型的特点都有比较深刻的认识。本文设计了—套基于特征自动选取的Na(i)ve Bayes模型用于汉语词义消歧问题。大量的实验测试表明,自动特征选取方法选取的特征,在相同的训练数据集上,可以改进词义消歧效果。

关键词：汉字处理汉语词义词义消歧数理语言学

作者: 何径舟王厚峰

作者单位: 北京大学信息科学技术学院,计算语言学研究所,北京 100871

会议类型: 国内会议

会议名称: 第四届全国学生计算语言学研讨会(SWCL-2008)

会议地点: 太原

会议语种:中文

页码: 35-41

在线出版日期: 2008-07-23（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于特征自动选取的汉语词义消歧