会议专题

一种统计和词性相结合的命名实体发现方法

在利用专业文献自动构建知识库的过程中,需要正确识别专业文献中的命名实体.针对命名实体识别问题,提出了一种以统计为主发现命名实体的方法.该方法利用隐式切分标记将原文切分为较短的汉字串,采用自增长统计算法从汉字串中生成原始模式集,并利用统计信息和词性信息筛选出命名实体.

命名实体处理 自增长统计 词性 信息提取 文本处理

庄明 老松杨 吴玲达

国防科技大学多媒体研究开发中心(长沙)

国内会议

第十二届全国多媒体技术学术会议

贵州

中文

179-184

2003-09-01(万方平台首次上网日期,不代表论文的发表时间)