会议专题

并行化的半监督朴素贝叶斯分类算法

  针对当前需要对海量的文本数据进行分类和用于训练的带标记的文本数据非常匮乏这两个问题,结合半监督的朴素贝叶斯分类算法和Map-Reduce编程模型,提出了一种新型的并行化的半监督朴素贝叶斯分类(PSNB)算法。通过实验可以看出,PSNB算法不仅可以高效地处理海量的文本数据,还可以有效地利用无标记的文本数据来提高分类器准确率。

文本分类器 朴素贝叶斯算法 编程模型 数据处理

JIANG Kai 江凯 GAO Yang 高阳

State Key Laboratory of Novel Software Technology, Nanjing University, Nanjing 210093, China 南京大学计算机软件新技术国家重点实验室,南京210093

国内会议

第29届中国数据库学术会议

合肥

中文

912-918

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)