基于最大概率法探讨中医症状信息提取与标准化
目的:通过比较两个基于最大概率法的症状提取方案,探讨中医症状信息的提取和标准化.方法:数据分析和处理在R3.3.2上进行.运用《诊断学》《中医诊断学》及1000份已标记的肺炎住院病历建立症状标准化数据库,症状描述词库和关键词-形容词词库.基于最大概率法分别设计出中文分词方案,直接提取方案和组合提取方案.并用这3种方案对2311份肺炎病历进行症状信息提取和标准化,从产生维度、手工处理情况、症状提取效果对方案进行比较.结果:直接提取方案和组合提取方案均能有效降低维度,组合提取方案手工处理百分比较小和症状提取效果较好.结论:基于最大概率法的组合提取方案能有效提取中医症状信息.
中医症状 文本挖掘 信息提取 标准化
梁礼铿 黎敬波
广州中医药大学,广州510006
国内会议
南昌
中文
2159-2162
2017-04-22(万方平台首次上网日期,不代表论文的发表时间)