会议专题

一种基于Hownet的词向量表示方法

  针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷,提出一种基于Hownet的词向量表示方法(H-WRL)。首先,基于义原独立性假设,将Hownet 中所有N 个义原指定为欧式空间的一个标准正交基,实现Hownet 义原向量初始化; 其次,根据Hownet 中词语与义原之间的定义关系,词语向量表示可以视为相关义原所张成的子空间中的投影,并提出学习词向量表示的深度神经网络模型。实验表明,基于Hownet 的词向量表示在词相似度计算和词义消歧两项标准评测任务中均取得很好的效果。

词向量表示 Hownet 词语相似性计算 词义消岐

陈洋 罗智勇

北京语言大学信息科学学院,北京 100083 北京语言大学语言信息处理研究所,北京 100083

国际会议

2018自然语言处理与中文计算国际会议(NLPCC2018)

呼和浩特

中文

1-8

2018-08-26(万方平台首次上网日期,不代表论文的发表时间)