会议专题

一种处理缺失数据的新方法

目前统计学上研究抽样调查时产生的缺失数据主要从减少误差入手,但对于含大量的缺失数据的数据集而言,就难以得到理想的估计效果.而对于许多含有缺失数据的数据集,统计学中处理这些数据集的方法主要有演绎估计、随机插补法、线性回归、聚类分析(均值插补法)及多重插补(MI)等方法.本文主要是介绍一种新的处理缺失数据的插补方法,它结合了回归分析和聚类分析的优点,能处理多种领域的数据.文中对数据集的处理都采用矩阵形式.

缺失数据 插补方法 回归分析 聚类分析 数据集

管河山 姜青山 Steven X.Wei

厦门大学数学科学学院,厦门,361005 厦门大学计算机科学系,厦门,361005 Shool of Banking and Finance University of New South Wales Sydne,NSW 2052 Australia

国内会议

第二十一届中国数据库学术会议

厦门

中文

357-359

2004-10-14(万方平台首次上网日期,不代表论文的发表时间)