结合超文本结构信息用k-NN方法分类超文本
k-NN,即k最近邻居法,是一个被广泛使用的学习算法,也是最基本的基于事例的学习方法。该文针对超文本结构中的结构特征,提出了用k-NN方法利用超文本页面中的文本信息和结构信息进行超文本分类的方法,并用Naive Bayes方法协调两个分类超文本网页。实验验证,综合分类器的分类正确率明显好于基于k-NN方法的文本分类器和结构信息分类器单独分类超文本时的效果。
结构信息分类 因特网 超文本 分类
范焱 陈恩红 蔡庆生 刘洁
中国科学技术大学计算机系(合肥)
国内会议
南京
中文
271~277
2000-11-01(万方平台首次上网日期,不代表论文的发表时间)