基于k-means的机构名聚类研究与应用

摘要：

本文分析了k-mean算法的核心思想和基本步骤,借鉴了现有基于频繁词集的文本聚类初始中心确定方法,提出了一种面向大规模机构名称规范处理应用的机构聚类方法,并基于此构建了机构规范名-别名映射表辅助构建工具,实验效果表现良好。

关键词：机构名称 K-means聚类算法频繁词集效果评估

作者: 孙海霞李军莲吴英杰李丹亚

作者单位: 中国医学科学院医学信息研究所北京 100020

会议类型: 国内会议

会议地点: 北京

会议语种:中文

页码: 60-65

在线出版日期: 2012-01-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题