会议专题

基于k-means的机构名聚类研究与应用

本文分析了k-mean算法的核心思想和基本步骤,借鉴了现有基于频繁词集的文本聚类初始中心确定方法,提出了一种面向大规模机构名称规范处理应用的机构聚类方法,并基于此构建了机构规范名-别名映射表辅助构建工具,实验效果表现良好。

机构名称 K-means聚类算法 频繁词集 效果评估

孙海霞 李军莲 吴英杰 李丹亚

中国医学科学院医学信息研究所 北京 100020

国内会议

中国医学科学院/北京协和医学院医学信息研究所/图书馆2011年学术年会

北京

中文

60-65

2012-01-01(万方平台首次上网日期,不代表论文的发表时间)