一种基于C4.5的改进TANC分类算法
针对树扩展型朴素贝叶斯分类器(TANC)在处理属性值缺失时将这部分缺失数据忽略且在处理连续型数据时会直接跳过,导致处理结果精确度降低的缺点,提出了一种基于C4.5的改进TANC分类算法,该算法首先利用C4.5的预测功能对训练集进行修改,从而使缺失数据补齐,同时通过将属性分割成多个有限lx间,使连续数据离散化,然后将修改后的训练集用以训练TANC,从而提高算法分类精度.将该算法应用于UCI数据集,实验结果表明,基于 C4.5的改进TANC分类算法比TANC具有更高的分类精度.
机器学习 分类器 C4.5算法 TANC
赵小强 杨佳敏
兰州理工大学电气工程与信息工程学院,甘肃兰州730050 兰州理工大学电气工程与信息工程学院,甘肃兰州730050;甘肃省工业过程先进控制实验室,甘肃兰州730050
国际会议
长沙
中文
4992-4996
2014-05-31(万方平台首次上网日期,不代表论文的发表时间)