藏语句子相似度算法的研究
该文提出了一种藏语句子相似度的计算方法,即采用散列单词倒排索引和基于句长相似度粗选的算法,快速从语料库中筛选出候选句子的集合,散列单词倒排索引能够有效提高算法的查找速度;再采用基于词形和连续单词序列相似度的多策略精选算法,可以有效衡量两个藏语句子的相似程度。实验结果证明算法是有效的。
藏语 句子相似模型 语言处理 连续单词序列 相似度算法
安见才让
青海民族大学计算机学院,青海西宁 810007
国内会议
呼和浩特
中文
110-114,121
2011-07-29(万方平台首次上网日期,不代表论文的发表时间)