会议专题

基于时间序列分析的动态分布平滑方法

统计语言模型在实际应用中显示出了不俗的效果,近年来使用得越来越广泛。但由于语言的灵活性,模型的数据稀疏问题始终不能避免,现有的平滑方法只考虑了模型中元素出现的频数,没有考虑到语言的使用是随着时间变化的。本文分析了模型中词语随着时间的变化而出现的频数变化情况,利用时间序列模型分析中的预测方法获得下一个阶段的数据来估计模型的参数,提出了一种对在时间线上频教增加的词语增加概率值,对频数减少的则降低概率值的动态分布平滑方法。实验数据显示,本平滑方法具有一定的优越性。

人工智能 统计语言模型 数据稀疏 时间序列分析 动态分布 平滑方法

黄永文 何中市 王海燕

重庆大学计算机学院,重庆市,400044 四川美术学院美术学系,重庆市,400052

国内会议

第六届博士生学术年会

北京

中文

368-375

2008-09-01(万方平台首次上网日期,不代表论文的发表时间)