对非随机缺失中的缺失依赖关系研究
数据缺失是一种十分重要而又很常见的数据质量问题.对缺失数据的常见处理方法为估计缺失值或者直接删除缺失记录.这两种方法都只用到了未缺失数据中的信息,而隐含在缺失记录中的信息则被舍弃了.在非随机缺失中各个缺失属性并不是独立的,其中存在着依赖关系.本文使用关联规则挖掘的技术,主要是关联规则挖掘,从发生非随机缺失的数据集中发现属性间的缺失依赖关系.利用发现的依赖关系,可以对数据分析或者信息采集改进提供帮助.通过在一个真实数据集上的实验,证明本文的方法可以有效的发现缺失中的依赖关系.
数据库 信息缺失 依赖关系 关联规则挖掘
郑奇斌 刁兴春 曹建军
解放军理工大学指挥信息系统学院,江苏南京210007
国内会议
北京
中文
1-7
2014-12-01(万方平台首次上网日期,不代表论文的发表时间)