会议专题

多领域中文依存树库构建与影响统计句法分析因素之分析

为提升依存分析并分析影响其精度的相关因素,该文构建了大规模中文通用依存树库和中等规模领域依存树库.基于这一系列树库,通过句法分析实验考察质量、规模、领域差异等因素对中文依存分析的影响,实验结果表明:树库规模和质量均与句法分析精度成正相关关系,质量应先于规模因素被优先考虑;通用树库和领域树库之间的差异程度与前者对后者的替代性成相关关系;两种树库混合使用的效果同样与领域差异有关.

中文依存树库 句法分析 树库规模 树库质量

邱立坤 史林林 王厚峰

鲁东大学文学院,山东省烟台市 264025 北京大学计算语言学研究所,北京市 100871

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-9

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)