基于词分布式表征的汉语框架排歧模型
框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架.该任务在一定程度上解决了动词中一词多义的现象.本文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型.与传统方法相比,本模型有效避免了人工选择特征,克服了特征空间维度过高、特征之间没有关联性等缺点,使框架排歧的准确率达到65.71%.并与当前最好的模型,进行显著性和一致性检验,进一步验证了词分布式表征对框架排歧任务的有效性.
汉语词汇 框架排歧 分布式表征
张力文 王瑞波 李茹 张晟
山西大学 计算机与信息技术学院,山西 太原 030006 山西大学 计算机与信息技术学院,山西 太原 030006;山西大学 软件学院,山西 太原 030006 山西大学 计算机与信息技术学院,山西 太原 030006;山西大学 计算智能与中文信息处理教育部重点实验室,山西 太原 030006;山西省大数据挖掘与智能技术协同创新中心,山西 太原 030006
国内会议
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
南京
中文
1-10
2017-10-13(万方平台首次上网日期,不代表论文的发表时间)