会议专题

报纸文献标引用知识库设计与构建研究

报纸文献主题标引、分类标引和命名实体抽取是其内容深加工的主要形式,基于知识库的自动 标引是报纸文献标引自动化的一种实现方式。本文在报纸文献自动标引研究现状基础上提炼出报纸文献自动 标引一般流程,提出知识库建设是其实现自动标引的前提。结合报纸文献标引的特点,提出报纸文献标引用 知识库应由主题标引库、分类知识库和实体标引库三部分多个词表组成,具有多词表融合、规模大、可扩充、 简单易行等特点。同时,就知识库构建中的主题规范表、分类主题对照表和命名实体抽取规则库建设等关键 技术进行阐述。

newspaper literature document indexing automatic indexing categorization knowledge base

薛春香

南京理工大学信息管理系,南京 210094

国内会议

第十七届海峡两岸信息管理发展与策略学术研讨会

南京

中文

1-7

2011-09-01(万方平台首次上网日期,不代表论文的发表时间)