基于可比语料库的双语术语抽取技术研究综述

双语术语抽取技术是自然语言处理的一项基础研究技术,其依赖于双语语料库。双语语料库可分为平行语料库与非平行语料库。非平行语料库中包含了可比语料库与准可 比语料库。对双语术语抽取技术中的一项重要分支:基于可比语料库的双语术语抽取技术 进行了对比分析。当前技术主要包含候选词的上下文特征的模型构造和上下文特征模型的 优化两项任务。分别对两项研究按照方法层次进行分析总结,指出存在的问题。最后对基于 可比语料库的双语术语抽取技术的未来进行了展望。
双语术语抽取 双语语料库 可比语料库 基于可比语料库的双语术语抽取 上下文特征
俞卓 黄河燕
南京理工大学计算机科学与技术学院 南京 2100094 北京理工大学计算机科学与技术学院 北京 100081;中国科学院计算机语言信息工程研究中心 北京 100097
国内会议
2010年全国高性能计算学术年会(HPC china2010)
北京
中文
460-468
2010-10-27(万方平台首次上网日期,不代表论文的发表时间)