结合特征选择和链接过滤的主动协作分类方法
网络数据分类是网络数据挖掘中的重要研究课题之一。协作分类方法利用网络节点之间的依赖关系对相互链接的节点集合进行组合分类,获得了高于传统分类方法的准确度,受到研究人员的广泛关注,并被应用于文档分类、蛋白质结构预测、自然语言处理、图像处理、社会网络分析等众多领域。本文提出一种结合特征选择和链接过滤的主动协作分类方法,算法首先基于最小冗余-最大相关方法选择重要的属性,并建立隐式链接,之后过滤显式链接以去除噪声链接,最后集成隐式链接和显式链接形成新的网络结构,并基于典型协作分类方法实现分类。在三个公共数据集上将本文方法分别与典型的基于属性的传统分类方法、协作分类方法进行对比,结果表明本文方法较优,尤其对于稀疏标记的网络,本文方法的优势更加明显。
协作分类 特征选择 链接过滤 主动学习
李丽娜 欧阳继红 刘大有
吉林大学计算机科学与技术学院 长春 130012
国内会议
长春
中文
1-10
2012-08-04(万方平台首次上网日期,不代表论文的发表时间)