会议专题

基于特征自动选取的汉语词义消歧

自然语言处理的许多问题都可以归结为分类问题,汉语词义消歧是一类典型的分类问题。在分类问题中,特征的选择至关重要。通常情况下,特征的选择由人工直接确定,这样的选取方式,要求选取者对于分类问题本身和机器学习模型的特点都有比较深刻的认识。 本文设计了—套基于特征自动选取的Na(i)ve Bayes模型用于汉语词义消歧问题。大量的实验测试表明,自动特征选取方法选取的特征,在相同的训练数据集上,可以改进词义消歧效果。

汉字处理 汉语词义 词义消歧 数理语言学

何径舟 王厚峰

北京大学信息科学技术学院,计算语言学研究所,北京 100871

国内会议

第四届全国学生计算语言学研讨会(SWCL-2008)

太原

中文

35-41

2008-07-23(万方平台首次上网日期,不代表论文的发表时间)