中文地址识别算法研究及在医院的应用
中文地址分析技术在本地搜索服务已经得到广泛应用,其实其在医院管理特别是医院病人来源性分析、病案地址标准化上报也存在重要的作用.该技术就是把自然语言描述的地址转化成机器可识别可定位的信息.基于正则表达式匹配无语义的方法,识别效果较差,全文的最大相似度计算方法虽然效果好,但是需要占用大量的计算资源和完整的基础资料,而利用分词和基于命名实体识别的思想来对地址进行分析,使得整体效果有了明显改善.
中文地址 命名实体识别 正则表达式 文本相似度
邓兴文 吴庆斌
暨南大学附属第一医院
国内会议
珠海
中文
1-6
2016-05-27(万方平台首次上网日期,不代表论文的发表时间)