利用语义相似度解决双语词汇知识获取的错误累计问题
在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义过滤的方法.实验结果表明该方法行之有效.并对HowNet以及WordNet相似度计算方法进行了基于实际应用的对比与探讨后得出:HowNet在语义区分上粒度更细因此其召回率较高,WordNet则具有更高的精确率.
词对齐 知识获取 HowNet 双语词汇 语义相似度 语义词典 错误累计 双语翻译
刘鹏远 赵铁军 李生 杨沐昀
哈尔滨工业大学,计算机学院,黑龙江,哈尔滨,150001
国内会议
第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)
哈尔滨
中文
575-579
2006-08-05(万方平台首次上网日期,不代表论文的发表时间)