一种基于MapReduce的分布式文本数据过滤模型研究
该文首先介绍了文本过滤模型的特点以及发展状况。针对传统信息过滤处理方式无法满足现阶段海量数据环境下业务需求这一现状,该文提出了一种基于MapReduce框架的文本数据过滤模型,实现了传统的向量空间模型的分布式扩展。在实际环境中的测试表明,该模型的过滤精度和速度都较为理想,较好的满足了用户的需求。
网络信息 文本过滤模型 MapReduce框架 向量空间模型
李虎 邹鹏 贾焰 周斌
国防科技大学计算机学院,湖南长沙410073
国内会议
武夷山
中文
91-93,119
2011-09-15(万方平台首次上网日期,不代表论文的发表时间)