基于k-means的机构名聚类研究与应用
本文分析了k-mean算法的核心思想和基本步骤,借鉴了现有基于频繁词集的文本聚类初始中心确定方法,提出了一种面向大规模机构名称规范处理应用的机构聚类方法,并基于此构建了机构规范名-别名映射表辅助构建工具,实验效果表现良好。
机构名称 K-means聚类算法 频繁词集 效果评估
孙海霞 李军莲 吴英杰 李丹亚
中国医学科学院医学信息研究所 北京 100020
国内会议
中国医学科学院/北京协和医学院医学信息研究所/图书馆2011年学术年会
北京
中文
60-65
2012-01-01(万方平台首次上网日期,不代表论文的发表时间)