一种基于向量空间模型的多层次网页分类方法
本文在研究了经典的向量空间模型(VSM)及网页分类模型的基础上,提出了一种基于向量空间模型的多层次网页分类方法.该方法用主题词向量、修正主题词向量和主题概念向量从三个层次表示网页,使得网页表示向量维数低于特征表示向量,从而降低了网页分类的计算量,提高了网页分类速度和正确率.
网页分类 文本分类 向量空间模型 特征提取 主题概念
鞠小林
南通大学计算机科学与技术学院,南通,226007
国内会议
全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会
南京
中文
18-20
2006-10-01(万方平台首次上网日期,不代表论文的发表时间)