会议专题

基于语块的中文问句相似度计算

分析了当前常用的汉语句子相似度计算方法及存在的问题,针对中文问句的特点,定义了问句的常规和特定语块,提出了一种基于语块的中文问句相似度计算方法,该方法以”知网”为基础,计算词语语义相似度,利用组块分析理论及HMM学习算法,识别问句常规语块,利用规则或学习方法提取问句特定语块,并分别计算两个问句中各问句语块之间的相似度,最终以语块相似度为基础实现问句相似度的计算.问句相似度计算方法对比实验结果说明,提出的方法具有更好的效果。

句子相似度 问句相似度 语块相似度 词相似度 常规语块 特定语块 分类技术

余正涛 胡磊 汤世平 郭剑毅

昆明理工大学信息工程与自动化学院,昆明,650051;北京理工大学计算机科学工程系,北京,100081 昆明理工大学信息工程与自动化学院,昆明,650051 北京理工大学计算机科学工程系,北京,100081

国内会议

2005第一届中国分类技术与应用研讨会(CSCA)

北京

中文

373-377

2005-09-23(万方平台首次上网日期,不代表论文的发表时间)