会议专题

典型参数平滑算法在词性标注中的性能评价

随着统计技术在自然语言处理领域的兴起,在语料理规模有限的情况下,参数平滑作为解决数据稀疏问题的主要方法显得十分重要.本文分析了几种常用参数平滑算法的优劣,在英语词性标注中比较了这几种算法的平滑效果.实验表明:在语料规模有限的情况下,线性插值和Katz”s回退平滑较优.本文通过在相同环境下对各算法的平滑效果的研究和实验,旨在为大家提供一个选择平滑算法的借鉴.

数据稀疏 参数平滑 词性标注 自然语言处理

朱莉 孟遥 赵铁军

哈尔滨工业大学计算机科学与技术学院(哈尔滨)

国内会议

全国第七届计算语言学联合学术会议

哈尔滨

中文

103-109

2003-08-01(万方平台首次上网日期,不代表论文的发表时间)