会议专题

领域本体构建研究及在专利信息服务中的应用

本体是语义检索的核心。本体构建主要包括领域概念获取和概念间关系获取,其中领域概念获取是本体构建的基础。本文采用基于最大熵模型的方法来获取概念,该模型首先通过对领域文本进行挖掘而得到名词性短语,然后使用改进的TF-IDF公式从中抽取具有领域性的短语,经人工修正后得到本体概念。本工作以专利服务平台为背景,并以电梯专利信息为例进行实际应用,结果表明此方法提高了概念的准确性和完整性。

信息查询 数据挖掘 语义检索 本体构建

孙涌 韦小丽

苏州大学 算机科学与技术学院,江苏 苏州 215006

国内会议

江苏省系统工程学会第十一届学术年会

镇江

中文

955-966

2009-10-01(万方平台首次上网日期,不代表论文的发表时间)