基于NLP技术后结构化处理的电子病历应用研究
目的:探索电子病历后结构化命名实体识别率。方法:抽取院内1000份运行电子病历,利用NLP技术进行语义识别。结论:本次评测抽取了1000份入院记录,针对检查、临床表现、药品等7个实体类别进行分类抽取,预料规模较大,实验取得了较好的识别效果。基于深度学习的方法可以利用更多的特征,帮助临床进行更好的数据抽取服务。但中文电子病历因有其独特的语言特性,医疗行业习惯用语大量出现,包含一些以数字和单位表示的检查结果和英文缩写词,句子语法结构不完整,模式化较强等,造成中文病历实体总体识别难度较大。我们应该根据中文电子病历文本明显的子语言特点,一是加强中文电子病历标注语料库的构建,二是逐步改善"拷贝、粘贴"这种易导致数据质量低下的输入模式,提升电子病历智能层级,创造高效、高质的信息抽取环境,提高大数据利用价值。
人工智能 后结构化 电子病历 文本识别 NLP
程楠 罗德芳
河南省人民医院网络信息中心 450003 河南省郑州市黄河路省医科教大厦 北京惠每科技有限公司
国内会议
贵阳
中文
66-70
2018-07-12(万方平台首次上网日期,不代表论文的发表时间)