会议专题

基于语义角色标注的汉语句子相似度算法

在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析.现有方法未能充分利用动词及其支配的成份信息,无法满足语义角色标注的相似句检索需求.基于此,本文提出一种新的汉语句子相似度计算方法.该方法基于已标注好语义角色的语料资源,以动词为分析核心,通过语义角色分析、标注句型的相似匹配、标注句型间相似度计算等步骤来实现句子语义的相似度量.为达到更好的实验效果,论文还综合比较了基于知网、词向量等多种计算词语相似度的算法,通过分析与实验对比,将实验效果最好的算法应用到句子相似度计算的研究中.实验结果显示,基于语义角色标注的句子相似度计算方法相对传统方法获得了更好的测试结果.

现代汉语 语义角色标注 词语相似度 词向量 标注句型匹配

田堃 柯永红 穗志方

北京大学信息科学技术学院,北京市100871

国内会议

第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD-2016)

烟台

中文

1-10

2016-10-14(万方平台首次上网日期,不代表论文的发表时间)