基于语义关系图的多关系朴素贝叶斯分类算法

多关系分类是数据挖掘领域中的研究和应用热点之一。已有多关系朴素贝叶斯分类算法将所有与目标表相连的表都考虑在内,其中包括语义关系很弱的表。为此,本文提出一种新的基于语义关系优化的多关系朴素贝叶斯分类算法--Graph-NB算法。该算法利用多表之间存在的不同语义关系,对表进行剪裁,以达到优化语义关系图以及消除无关表对分类影响的目的,同时可以提高分类效率。该算法实现了深度优先与广度优先两种不同的遍历策略,通过比较分析与其他算法在多个真实数据库和合成数据库上的测试结果以及两种不同遍历策略的优劣势,可以发现Graph-NB算法分类准确度高,算法运行时间短,优于之前的许多多关系分类算法。
多关系分类 朴素贝叶斯分类 语义关系图 深度优先 广度优先 数据挖掘
刘红岩 陈海亮 Han Jiawei Yin Xiaoxin
清华大学经济管理学院 北京 100084 美国伊利诺大学香槟分校计算机科学系 厄巴纳 61801
国内会议
昆明
中文
220-225
2007-11-08(万方平台首次上网日期,不代表论文的发表时间)