会议专题

基于聚类分析的主题演化方法研究综述

在科学技术日益发展的今天,新的知识以几何级数增加,而且数字资源所占的比重越来越大,如何从中快速准确的获取知识发展脉络以及知识演化结构是目前科研人员和情报分析人员共同面临的问题,本文针对该问题,从聚类角度对当前主题演化方法进行调研和梳理,了解目前基于聚类分析的主题演化方法研究进展,指出虽然目前对聚类方法已经相当成熟,但是对于聚集类簇的动态演化研究才刚刚兴起,主要关注的是数据集中潜在结构的动态变化及其背后的内在动因,按照这类方法的适用条件,一般将主题演化分为离线数据集聚类和在线数据集聚类,在线数据集聚类主要是对高可变的数据流进行实时聚类分析。其中典型的方法有Chakrabarti在2006提出的演化聚类,以及已经存在的数据流聚类、增量聚类和约束聚类。

科学知识 主题演化 数据集 聚类分析

赵迎光

中国医学科学院医学信息研究所 北京100020

国内会议

中华医学会第第二十次全国医学信息学术会议

重庆

中文

386-388

2014-05-27(万方平台首次上网日期,不代表论文的发表时间)