一种统计和词性相结合的命名实体发现方法
在利用专业文献自动构建知识库的过程中,需要正确识别专业文献中的命名实体.针对命名实体识别问题,提出了一种以统计为主发现命名实体的方法.该方法利用隐式切分标记将原文切分为较短的汉字串,采用自增长统计算法从汉字串中生成原始模式集,并利用统计信息和词性信息筛选出命名实体.
命名实体处理 自增长统计 词性 信息提取 文本处理
庄明 老松杨 吴玲达
国防科技大学多媒体研究开发中心(长沙)
国内会议
贵州
中文
179-184
2003-09-01(万方平台首次上网日期,不代表论文的发表时间)