基于距离的不确定离群点检测
在诸如网络入侵、无线传感器网络异常事件等检测应用中,离群点检测是一项具有很高应用价值的技术。这项技术在确定性数据中已经得到了深入的研究,但在新兴的不确定数据领域却是一项新的研究课题。在无线传感嚣网络、数据集成和数据挖掘等技术中使用不确定数据模型,更能真实反映现实世界,进一步提高这些技术的实际可行性。本文针对不确定数据下的离群点提出新的定义。并提出基于距离的不确定数据离群点检测的高效过滤方法,包括基础过滤方法b-RFA和改进方法o-RFA,最后提出高效概率计算方法DPA。b-RFA方法利用非离群点的过滤性质,减少检测次数;o-RFA方法通过挖掘数据分布信息对b-RFA方法做出改进,进一步提高过滤效率;DPA方法找到概率求解中的递推规律,极大提高了单点检测效率。实验证明本文提出的过滤方法和检测方法都具有良好的性能。
不确定数据 离群点检测 过滤方法 网络入侵 数据模型
于浩 王斌 肖刚 杨晓春
东北大学信息科学与工程学院 沈阳 110004
国内会议
南昌
中文
143-150
2009-10-15(万方平台首次上网日期,不代表论文的发表时间)