报纸文献标引用知识库设计与构建研究
报纸文献主题标引、分类标引和命名实体抽取是其内容深加工的主要形式,基于知识库的自动 标引是报纸文献标引自动化的一种实现方式。本文在报纸文献自动标引研究现状基础上提炼出报纸文献自动 标引一般流程,提出知识库建设是其实现自动标引的前提。结合报纸文献标引的特点,提出报纸文献标引用 知识库应由主题标引库、分类知识库和实体标引库三部分多个词表组成,具有多词表融合、规模大、可扩充、 简单易行等特点。同时,就知识库构建中的主题规范表、分类主题对照表和命名实体抽取规则库建设等关键 技术进行阐述。
newspaper literature document indexing automatic indexing categorization knowledge base
薛春香
南京理工大学信息管理系,南京 210094
国内会议
南京
中文
1-7
2011-09-01(万方平台首次上网日期,不代表论文的发表时间)