基于归纳学习的Internet文本信息发掘与过滤

该文以Internet中的信息获取与知识发现为背景,利用基于概率统计的归纳学习方法,通过对训练样本集合中的有效词统计、标注来构造领域关键词库,获得文本类属的参数估计,并利用参数估计值判断测试样本的可信度。通过不同领域的样本集合进行文本分类算法的研究,获取基于知识的网络信息分类与过滤机制,文中对所用的理论方法及其实现模型进行了讨论,并给出了相应的实验结果及应用实例。
文本信息 类属概率 归纳学习 信息过滤 信息检查 信息发掘
杨波 刘斐 孙奕奇
山东建材学院网络中心(济南)
国内会议
合肥
中文
2749~2752
2000-06-01(万方平台首次上网日期,不代表论文的发表时间)