会议专题

基于支撑向量机的人物关系抽取

互联网逐步的渗透在人们的社会生活中,人们试图通过网络扩展交往的范围,寻找自己感兴趣的人并与之取得联系。本文定义了8种人物关系,通过分类的方法实现了自由文本中人物关系的自动抽取.在特征词的选取上,根据抽取对象自身的特点提出了人物主体上下文、人物主体上下文词性、人物分组数与核心特征词四种选择方法,其中核心特征词是结合bootstrapping算法选取的。实验结果表明:分类的方法适合人物关系的抽取,人物分组与核心特征词的选择有利于实验结果的提高。

人物关系 信息抽取 特征选取 bootstrapping算法 支撑向量机 核心特征词

韩冰 林鸿飞

大连理工大学计算机科学与工程系,大连,116024

国内会议

第七届中文信息处理国际会议

武汉

中文

335-341

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)