QAR数据仓库中的数据预处理方法研究
数据预处理是提高QAR数据仓库数据质量的关键。译码后的QAR数据中通常存在大量的空缺值、重复记录和噪声数据,严重影响着QAR数据分析的效果。通过对构建QAR数据仓库数据存在的问题进行全面分析,设计了基于主题的QAR数据预处理方法,该方法主包括数据提取、空缺值填补、集成,不仅针对QAR数据的特点改进了数据质量,而且按分析主题对QAR数据进行了重新整合,为QAR数据的进一步的分析和挖掘奠定了很好的基础。
QAR数据仓库 数据预处理 数据提取 空缺值填补 数据集成
王红 郇秀霞 王宏伟
中国民航大学计算机科学与技术学院,天津 300300
国内会议
烟台
中文
1-3
2008-08-14(万方平台首次上网日期,不代表论文的发表时间)