基于条件随机场的汉语词性标注
近年来条件随机场广泛应用于各类序列数据标注中,汉语词性标注中应用条件随机场对上下文建模时会扩展出数以亿计的特征,在深入分析特征产生机理的基础上对特征模板集进行了优化,采用条件随机场进一步研究了汉语词性标注中设定的特征模板集、扩展出的特征数、训练后模型大小、词性标注精度等指标之间的关系。实验结果表明,优化后的特征模板集在模型训练时间、训练后模型大小、标注精度等指标上达到了整体最优。
汉语词性标注 条件随机场 特征模板集 上下文特征
于江德 葛彦强 余正涛
安阳师范学院计算机与信息工程学院,河南 安阳 455002 昆明理工大学信息工程与自动化学院,云南 昆明 650051
国内会议
徐州
中文
63-66
2011-10-22(万方平台首次上网日期,不代表论文的发表时间)