会议专题

基于“产生判别”混合模型的分类器领域适应性问题研究

本文针对自然语言理解中的领域适应性问题,从领域概率分布的角度给出了一种摹于混合模型的领域适应性学习方法,它可以把判别式模型和产生式模型集成到一个模型当中。判别式模型比产生式模型有较好的分类效果,但是产生式模型的优势在于在训练过程中可以较容易的引入非标注样本从而具有较好的推广性能。混合模型可以集中他们各自的优势。对于领域适应性,我们的方法利用不同领域概率分布之间的的差异性,调节训练集中样本的权重,从而使得训练得到的分类器更加适应于目标领域。在多个NLP任务应用本方法得到的实验结果可以证明本方法的有效性,说明相对于传统监督学习以及半监督学习的方法,本文方法有很大的优势,同时也证明了混合模型的方法要优于单个模型的方法。

领域适应性 混合模型 自然语言理解

刘康 赵军

中国科学院自动化研究所,北京 100190

国内会议

2008年全国模式识别学术会议

北京

中文

7-12

2008-10-22(万方平台首次上网日期,不代表论文的发表时间)