会议专题

面向双语句对检索的汉语句子相似度计算

在基于大规模的双语句对语料库的英文辅助写作系统中,我们采用了一种改进编辑距离的句子相似度计算方法,即对以往的编辑距离算法进行适当的调整,考虑了更多的汉语结构信息,使之更加符合汉语的句子相似度计算.同时使用了HowNet和《同义词词林》两部语义辞典作为语义资源,计算词汇之间的相似度.改进编辑距离的算法与单纯基于语义辞典计算句子相似度的算法相比,具有便于扩展,准确率高等优点,在英文辅助写作领域取得了令人满意的效果.对其进行适当的改进后,可适于多数需要计算句子相似度的应用领域.

句子相似度 编辑距离 英文辅助写作

车万翔 刘挺 秦兵 李生

哈尔滨工业大学计算机学院(哈尔滨)

国内会议

全国第七届计算语言学联合学术会议

哈尔滨

中文

520-526

2003-08-01(万方平台首次上网日期,不代表论文的发表时间)