藉由虚拟样本改善集成法的分类正确率
如何从资料中撷取出有意义的资讯,统计理论在过往扮演着重要的角色,然囿于其对于母体假设的基本限制,已无法因应现实世界中各种不同面向的资料,因此资料探勘与类神经网路等机械学习方法于近二十年来有着长足的蓬勃发展.其中在分类问题方面,相较于单一分类器的学习程序,集成法的提出可以有效减少过度配适问题的发生,如拔靴集成法、多模激发法等,其藉由拔靴法生成多个子训练样本集以建构多个子分类器,并将结果进行整合,虽能增进单一分类器的分类正确率,但其改善效果仍属有限,乃因此些子分类器系针对属性值与训练样本相同的子训练样本集进行重复性的学习之故.为使子分类器能够对拔靴样本以外的属性值进行学习,本研究拟采盒须图进行训练样本的值域推估并藉以生成虚拟样本以充实子训练样本集.本论文目前规划使用公开资料库UCI上所取得之资料进行测试,冀能提升拔靴集成法对于测试样本的分类正确率.
机器学习 虚拟样本 盒须图 拔靴集成法 分类正确率
蔡东亦 陈志玮 张哲荣 陈建智 利德江
中华医事科技大学资讯管理系 台南市 71003 国立成功大学工业与资讯管理学系 台南市 70101 中原大學企业管理学系 桃園縣 32023
国内会议
武汉
中文
576-581
2016-04-22(万方平台首次上网日期,不代表论文的发表时间)