会议专题

网络百科属性抽取

  本文提出了一种基于中文网络百科的属性抽取方法。该方法以中文网络百科自由文本为数据源,将属性值看作命名实体,对已分类的百科文本进行频繁模式的挖掘。通过分析频繁模式中词语序列与命名实体的关联关系,得到属性模式与属性词语,借助外部语义资源以及词语相似度计算去除重复的属性词语,得到统一的属性名称。本文对多个类别的中文百科条目进行了属性抽取实验,实验结果表明了该方法的可行性和有效性。

中文网络百科 文本聚类 信息抽取 属性值 关联规则挖掘

JIA Zhen 贾真 YIN Hong-Feng 尹红风 LI Tian-Rui 李天瑞

School of Information and Science Technology, Southwest Jiaotong University, Chengdu 610031, China 西南交通大学 信息科学与技术学院,成都 610031

国内会议

2012全国高性能计算学术年会

张家界

中文

1-4

2012-10-29(万方平台首次上网日期,不代表论文的发表时间)