SLOT:基于估计的高效子空间局部离群点发现
离群点发现(outlierdetection)是数据挖掘(datamining)的一项重要技术,其目标是发现数据集中行为异常的少量数据对象,这在网络监控、金融欺诈、数据清洗等许多领域都有着很强的应用背景.对于不同数据区域之间密度差别较大的数据而言,基于密度的局部离群点定义比较有效;对于分布稀疏的高维数据,需要在子空间中定义离群点以克服”维度灾难”(curseofdimensionality).对现实生活中的数据要同时考虑”局部”和”子空间”的性质.简单地将现有的寻找局部离群点和子空间离群点的方法结合起来是不可行的.本文提出一种针对高维种属(categorical)属性的数据集,在子空问中进行局部离群点检测的方法SLOT(Subspace Local Outlier Test),它具有如下 本文其余部分组织如下:第2节简单介绍现有的离群点发现方法;第3节详细描述基于密度的局部离群点定义,并举例说明其不足;寻找子空间局都离群点的具体算法在第4节中给出;第5节是相关实验和讨论;最后,总结全文,并给出了本文的后续工作。
高效子空间 离群点发现 高维种属 数据集
魏藜 钱卫宁 周傲英
复旦大学计算机科学与工程系,上海,200433
国内会议
郑州
中文
122-125,161
2002-08-26(万方平台首次上网日期,不代表论文的发表时间)