基于汉英平行语料库的英文显式篇章关系识别
汉英篇章平行语料库有助于基于篇章的双语研究,该文构建了汉英平行语料库,对语料中的汉语及其英语对译中的连接词分别进行了标注和关系分类.其中英文连接词比单语语料上的英文连接词定义广泛,更为复杂.该文在此语料上,抽取词法、句法和位置信息等特征在英文文本上进行显式篇章关系识别,实验采用最大熵分类方法,获得连接词识别正确率92.5%;抽取英文和对应中文连接词作为特征获得给定连接词关系分类正确率85.6%.为今后的中英篇章关系对比识别提供参考.
英文文本 显式篇章关系 识别方法 汉英平行语料库
冯洪玉 李艳翠 冯文贺 周国栋
河南科技学院信息工程学院,河南 新乡 453003;苏州大学计算机科学与技术学院,江苏 苏州 215006 河南科技学院文法学院,河南 新乡 453003 苏州大学计算机科学与技术学院,江苏 苏州 215006
国内会议
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
广州
中文
1-9
2015-11-13(万方平台首次上网日期,不代表论文的发表时间)