一种统计和词性相结合的命名实体发现方法

摘要：

在利用专业文献自动构建知识库的过程中,需要正确识别专业文献中的命名实体.针对命名实体识别问题,提出了一种以统计为主发现命名实体的方法.该方法利用隐式切分标记将原文切分为较短的汉字串,采用自增长统计算法从汉字串中生成原始模式集,并利用统计信息和词性信息筛选出命名实体.

关键词：命名实体处理自增长统计词性信息提取文本处理

作者: 庄明老松杨吴玲达

作者单位: 国防科技大学多媒体研究开发中心(长沙)

会议类型: 国内会议

会议地点: 贵州

会议语种:中文

页码: 179-184

在线出版日期: 2003-09-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题