会议专题

指标信息抽取技术的研究

本文研究了一种指标信息抽取技术。其基本思想是,首先人工建立指标知识库。 然后,由文本分析器借助指标知识库分析文本信息,形成指标向量。指标向量包括属性向量和数量词向量两部分。属性向量由属性词、位置、词频组成。数量词向量由数量词、位置组成。最终,由信息抽取器根据指标向量和知识库信息,智能地抽取出指标的五大信息,即指标属性、指标值、指标单位、指标代码、指标名称,指标的五项信息之间存在关联关系。

关键词 知识库 信息抽取 指标向量 文本分析器

肖诗斌 孙丽华 王弘尉 施水才

TRS信息技术有限公司,北京100101

国内会议

第三届全国信息检索与内容安全学术会议

苏州

中文

622-627

2007-11-01(万方平台首次上网日期,不代表论文的发表时间)