面向隐马尔可夫特征的数据质量控制模型
为了在进行数据质量控制时,考虑数据的具体特征以提高数据质量,分析了当前基于贝叶斯网络进行数据质量控制的模型、改进模型及其效果.针对字段之间存在”隐马尔可夫”关系的数据,提出了一种面向隐马尔可夫特征的数据质量控制模型,利用贝叶斯网络结构算法确定字段之间是否存在的”空间”上的关系,并且利用隐马尔可夫模型的Baum-Welch算法学习字段之间的生成概率矩阵(反映字段之间的依赖关系)和记录之间转移概率矩阵(反映记录之间的时间依赖关系),作为推理的依据.仿真实验表明,将”空间”和”时间”上的依赖关系有机结合起来预测或校验数据,对于存在”隐马尔可夫”关系的数据质量控制的提升效果显著,验证了模型的有效性.
数据挖掘 质量控制 贝叶斯网络 隐马尔可夫模型
周金陵 刁兴春 周星 曹建军
解放军理工大学指挥信息系统学院,江苏南京210007
国内会议
北京
中文
1-8
2014-12-01(万方平台首次上网日期,不代表论文的发表时间)