会议专题

基于KL距离的TAN分类器判别性学习方法

分类是机器学习、数据挖掘和模式识别领域中的一个重要研究方向。Bayesian分类器建立在Bayes统计和Bayesian网络方法的基础上,是一种最优分类器模型。常见的贝叶斯分类器模型有NB(Naive Bayes)分类器、TAN(Tree-augmentedNaive Bayes)分类器、GBN(General BayesianNetwork)分类器等。NB分类器要求在给定类变量的情况下各属性结点条件独立,TAN分类器相对放宽了NB分类器的条件独立性约束,而GBN分类器对网络结构没有限制,能够构造出更符合实际的模型。本文提出了一种基于KL距离的TAN分类器判别性学习方法。首先用基于信息理论的EAR(explaining away residual)方法构建TAN分类器的结构,然后通过优化基于KL距离的目标函数估计TAN分类器的参数。在UCI数据集以及人工合成数据集上的实验结果表明,使用本文方法学习的TAN分类器与采用衍生性学习策略相比能达到更高的分类正确率。

分类器 判别性学习 机器学习 数据挖掘 贝叶斯

冯奇 田凤占 黄厚宽

北京交通大学计算机与信息技术学院,北京 100044

国内会议

第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议(CRSSC-CWI-CGrC”2007)

太原

中文

82-85

2007-08-01(万方平台首次上网日期,不代表论文的发表时间)