会议专题

基于可达概率区间的不确定决策树

  针对不确定数据的概率分布难以获取的客观实际,讨论了缺失概率分布的值不确定离散对象的决策树。定义了(条件)概率区间,并证明了(条件)概率区间是可达概率区间;基于可达概率区间,定义了(条件)熵区间,并给出了求解(条件)熵区间的上/下界的方法;采用条件熵区间作为属性选择度量,提出了一种新的不确定决策树,将以0-1划分对象的决策树扩展到以概率区间分配对象的决策树,这样不仅可以处理缺失概率分布的值不确定离散对象,也可以处理确定离散对象。通过在基于UCI数据集的不确定数据集上的实验,证实了不确定决策树是有效的。

数据处理 离散对象 决策树算法 可达概率区间

CHEN Hongmei 陈红梅 WANG Lizhen 王丽珍 LIU Weiyi 刘惟一 YUAN Lijian 袁立坚

Department of Computer Science and Engineering, School of Information Science and Engineering, Yunna 云南大学信息学院计算机科学与工程系,昆明650091 Library, Kunming Metallurgy College, Kunming 650033, China 昆明冶金高等专科学校图书馆,昆明650033

国内会议

第29届中国数据库学术会议

合肥

中文

726-740

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)