网络百科属性抽取

摘要：

　　本文提出了一种基于中文网络百科的属性抽取方法。该方法以中文网络百科自由文本为数据源，将属性值看作命名实体，对已分类的百科文本进行频繁模式的挖掘。通过分析频繁模式中词语序列与命名实体的关联关系，得到属性模式与属性词语，借助外部语义资源以及词语相似度计算去除重复的属性词语，得到统一的属性名称。本文对多个类别的中文百科条目进行了属性抽取实验，实验结果表明了该方法的可行性和有效性。

关键词：中文网络百科文本聚类信息抽取属性值关联规则挖掘

作者: JIA Zhen 贾真 YIN Hong-Feng 尹红风 LI Tian-Rui 李天瑞

作者单位: School of Information and Science Technology, Southwest Jiaotong University, Chengdu 610031, China 西南交通大学信息科学与技术学院,成都 610031

会议类型: 国内会议

会议名称: 2012全国高性能计算学术年会

会议地点: 张家界

会议语种:中文

页码: 1-4

在线出版日期: 2012-10-29（万方平台首次上网日期，不代表论文的发表时间）

会议专题

网络百科属性抽取