会议专题

中文病历文本中时间信息自动标注

  中文病历文本中的时间信息提取对于实现医疗信息结构化,促进临床决策支持、医疗信息挖掘等信息综合利用具有重大意义。本文通过时间表达提取和时间规范化表示两个步骤实现时间信息的提取,利用正则匹配方法实现时间表达的提取;提出了中文病历文本中时间信息参考时间的分类和选取规律,并参考国际时间标注标准制定了针对医学领域的时间规范化表示方法,实现时间规范化表示,最终实现中文病历文本中时间信息的提取。本研究利用147份实际病历文本进行实验,其中包含表达完整时间概念的时间信息1207条,实验结果表明该方法可涵盖病历文本语料中96%以上的时间信息,正确率可达91%。

文本语料 时间信息 提取实验 正则表达式 中文病历 自动标注

周小甲 周庆利

浙江大学医学院附属妇产科医院 医学工程科, 浙江 杭州 310006

国内会议

中华医学会医学工程分会第十二次学术年会暨2011中华临床工程及医疗信息化大会

安徽屯溪

中文

1-6

2011-09-22(万方平台首次上网日期,不代表论文的发表时间)