利用分块重要度进行中文网页分类的研究
由于网页中存在着许多”噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作.但网页可以划分成不同的块,对分类而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网页分块技术,并通过实验验证了基于分块重要度的主题网页分类法的分类质量优于传统的主题网页分类法.
网页分割 块重要度 网页分类
段昕 马军 宋玲
山东大学,计算机科学与技术学院,山东,济南,250061 山东建筑大学,计算机科学与技术系,山东,济南,250101
国内会议
第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)
济南
中文
108-111
2006-07-21(万方平台首次上网日期,不代表论文的发表时间)