会议专题

一种基于《知网》的汉语词语词义消歧方法

词义消歧是自然语言处理中需要解决的一个重点和难点问题.目前需要用到自然语言处理的应用领域有很多,如:机器翻译、信息获取、内容和主题分析、文本分类以及语音识别等.本文提出了一种简单的无指导的词义消歧方法,它以《知网》的词汇语义相似度计算为基础,将歧义词的概念与句子中其它实词的概念作相似度计算,通过相似度的大小来判断歧义词的词义.其实验结果与Senseval-2和Senseval-3官方结果相比,得到了较好的消歧效果.且避免了基于机器可读词典和基于语料库的统计方法中存在的主要问题.

词义消歧 汉语词语 自然语言处理

余晓峰 刘鹏远 赵铁军

哈尔滨工业大学计算机学院(哈尔滨)

国内会议

第二届全国学生计算语言学研讨会

北京

中文

128-133

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)