会议专题

基于熵度量的空间邻域离群点查找

离群点的查找算法主要有两类:第一类是面向统计数据,把各种数据都看成是多维空间.没有区分空间维与非空间维,这类算法可能产生错误的判断或找到的是无意义的离群点;第二类算法面向空间数据,区分空间维与非空间维,但该类算法查找效率太低或不能查找邻域离群点.引入熵权的概念,提出了一种新的基于熵权的空间邻域离群点度量算法.算法面向空间数据,区分空间维与非空间维,利用空间索引划分空间邻域,用非空间属性计算空间偏离因子,由此度量空间邻域的离群点.理论分析表明,该算法是合理的.实验结果表明,算法具有对用户依赖性小、检测精度和计算效率高的优点.

熵度量 空间邻域离群点 偏离因子 空间划分 度量算法

苏锦旗 薛惠锋 吴慧欣

西北工业大学,自动化学院,西安,710072 华北水利水电学院,信息工程学院,郑州,450011

国内会议

2009年全国理论计算机科学学术年会

哈尔滨

中文

41-43,50

2009-08-07(万方平台首次上网日期,不代表论文的发表时间)