Web数据挖掘中的数据预处理和后处理
由于Web数据格式的无结构半结构特点,使得Web挖掘很难规范处理它的数据;Web挖掘发现的知识不易更好地结合Web特点呈现给用户.为了解决上述问题,本文综合论述了Web挖掘数据预处理和后处理并第一次提出了Web挖掘数据后处理的概念.提高数据挖掘过程中数据处理的地位是为了更好地发现知识,我们开发了数据预处理和后处理的软件来支持本文提出的观点,实验证明我们的数据预处理和后处理软件提高了Web知识发现的效率.
Web挖掘 数据预处理 数据后处理 Web数据格式 知识发现
耿增民 刘万春 朱玉文 杨静
中国原子能科学研究院,北京,102413;北京理工大学计算机科学与工程系,北京,100081 北京理工大学计算机科学与工程系,北京,100081 中国原子能科学研究院,北京,102413
国内会议
武汉
中文
216-222
2005-09-20(万方平台首次上网日期,不代表论文的发表时间)