会议专题

基于MYCIN推理模型的单词语义相似度度量

通过结合MYCIN推理模型和知识库,提出一个新颖的度量单词语义相似度的途径.首先借助通用本体WordNet定义并量化单词对距离与深度,其次利用统计和分段线性插值技术计算规则的确定因子,然后使用证据合取公式获得综合确定因子,最后建模单词语义相似度.在数据集R&G(65)上,对比该算法评判结果与人类评判结果的相关度,采用5折交叉验证对算法进行分析,相关度达到0.914,比当前最优方法P&S高出0.6个百分点,比经典算法HS,JC,LC,L和R高出7~13个百分点;在数据集M&C(30)和WordSim353上也取得了比较好的实验结果,相关度分别为0.914和0.939;且算法的运行效率和经典算法相当.实验结果显示使用MYCIN推理模型解决单词语义相似度问题是合理有效的.

单词 语义相似度 推理模型 知识库

王俊华 左万利 刘刚

吉林大学计算机科学与技术学院 长春130012 长春工业大学软件学院 长春130012

国内会议

第31届中国数据库学术会议

太原

中文

153-162

2014-09-19(万方平台首次上网日期,不代表论文的发表时间)