会议专题

基于中心语块扩展的汉藏基本名词短语对识别

本文提出汉藏基本名词短语对齐框架。从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏文语言的特殊性,提出基于中心语块扩展的藏文基本名词短语识别方法。提出词典与自动词对齐结果相结合的方法和基于序列相交的方法抽取藏文中心语块;再以扩展可信度为依据扩展中心语块。实验结果表明,基于序列相交的方法所抽取的汉藏基本名词短语对能够节省人工校正的工作量,有效辅助于汉藏基本名词短语库的建设。

诺明花 刘汇丹 马龙龙 吴健 丁治明

中国科学院软件研究所,北京 中国科学院研究生院,北京 中国科学院软件研究所,北京 中国科学院软件研究所 北京

国内会议

第六届全国青年计算语言学会议

上海

中文

194-200

2012-11-17(万方平台首次上网日期,不代表论文的发表时间)