聚焦 Bakeoff
Bakeoff是国际中文自动分词评测的品牌。它已分别在2003年日本和2005年韩国举办过两届。Bakeoff究竟给自动分词的传统理念带来什么冲击?从Bakeoff的评测结果来看自动分词系统的性能两年来有多大提升?中文分词技术又有哪些进步?这是本文要讨论的几个问题。本文首先通过每届Bakeoff提供的基线(Baseline)和顶线(Topline)数据指出,未登录词识别引起的分词精度失落八倍于分词歧义带来的失落。这说明能够大力提升未登录词召回率的分词技术必将成为今后一个时期的研究热点。严格地说,在不同测试集上得到的分词性能指标不具有可比性。本文建议通过一个分词系统在指定语料库上对于其基线的相对分词精度△F来实现不同年度分词指标的对比。统计表明在AS、CityU和PKU三语料库上前三名参赛系统的平均相对精度△FAve2005年和2003年相比最大增幅达20.2%(CityU),而前三名平均未登录词召回率RooV.Ave最大增幅达0121(AS)。通过对两届Bakeoff参赛系统的调查还可以看到,基于汉字(character-based)标注的最大熵(ME)和条件随机场(CRF)模型已成为当今自动分词技术的佼佼者。
汉语教学 中文自动分词 性能评测 中文信息处理
黄昌宁
北京微软亚洲研究院,100080
国内会议
香港
中文
20-27
2006-07-19(万方平台首次上网日期,不代表论文的发表时间)