会议专题

藏语句子相似度算法的研究

  该文提出了一种藏语句子相似度的计算方法,即采用散列单词倒排索引和基于句长相似度粗选的算法,快速从语料库中筛选出候选句子的集合,散列单词倒排索引能够有效提高算法的查找速度;再采用基于词形和连续单词序列相似度的多策略精选算法,可以有效衡量两个藏语句子的相似程度。实验结果证明算法是有效的。

藏语 句子相似模型 语言处理 连续单词序列 相似度算法

安见才让

青海民族大学计算机学院,青海西宁 810007

国内会议

第十三届中国少数民族语言文字信息处理学术研讨会

呼和浩特

中文

110-114,121

2011-07-29(万方平台首次上网日期,不代表论文的发表时间)