词语多义的表征
词义自动消歧长时期以来一直是自然语言处理中的热点难题。词语多义的表征主要有下面四种形式:(1)意义训释,(2)语义原语,(3)语义关系,(4)框架网络。人和计算机都是借助词语出现的上下文语境来消解词语歧义的,而上述四种语义表征方式都没有描述词语的上下文知识。本文主张采用复杂特征集的形式来描述词语丰富的句法分布信息,凸显词语不同意义之间的区别性特征,更利于计算机自动歧义消歧。
多义词 词义表征 词义消歧 自然语言处理 复杂特征集
吴云芳 刘扬 俞士汶
北京大学计算语言学研究所 北京 100871
国内会议
北京
中文
407-414
2005-12-21(万方平台首次上网日期,不代表论文的发表时间)