汉藏短语抽取
本文将从汉藏法律法规和公文领域平行语料中提取双浯短语对。考虑现阶段藏文资源不足,提出两步汉藏短语抽取方法。第—步是提取汉语语块,这部分工作不是本文工作重点。第二步是获取待翻译汉语短语的译文,该模块提出藏文词序列相交算法抽取藏文短语。该算法可以很好的抽取1-1和1-n连续和非连续藏文短语。
汉藏短语抽取 藏文信息处理 中文信息处理
诺明花 张立强 刘汇丹 吴健 丁治明
中国科学院软件研究所,北京 100190 中国科学院研究生院,北京 100190 中国科学院软件研究所,北京 100190
国内会议
武汉
中文
303-309
2010-10-11(万方平台首次上网日期,不代表论文的发表时间)