典型参数平滑算法在词性标注中的性能评价
随着统计技术在自然语言处理领域的兴起,在语料理规模有限的情况下,参数平滑作为解决数据稀疏问题的主要方法显得十分重要.本文分析了几种常用参数平滑算法的优劣,在英语词性标注中比较了这几种算法的平滑效果.实验表明:在语料规模有限的情况下,线性插值和Katz”s回退平滑较优.本文通过在相同环境下对各算法的平滑效果的研究和实验,旨在为大家提供一个选择平滑算法的借鉴.
数据稀疏 参数平滑 词性标注 自然语言处理
朱莉 孟遥 赵铁军
哈尔滨工业大学计算机科学与技术学院(哈尔滨)
国内会议
哈尔滨
中文
103-109
2003-08-01(万方平台首次上网日期,不代表论文的发表时间)