会议专题

实体关系自动抽取

实体关系抽取是信息抽取研究领域中的重要研究课题.本文使用两种基于特征向量的机器学习算法,Winnow和支持向量机(SVM),在2004年ACE(Automatic Content Extraction)评测的训练数据上进行实体关系抽取实验.两种算法都进行适当的特征选择,当选择每个实体的左右两个词为特征时,达到最好的抽取效果,Winnow和SVM算法的加权平均F-Score分别为73.08﹪和73.27﹪.可见在使用相同的特征向量,不同的学习算法进行实体关系的识别时,最终性能差别不大.因此使用自动的方法进行实体关系抽取时,应当集中精力寻找好的特征.

实体关系抽取 特征选择 信息抽取 特征向量 机器学习

车万翔 刘挺 李生

哈尔滨工业大学计算机学院信息检索研究室(哈尔滨)

国内会议

第一届全国信息检索与内容安全学术会议

上海

中文

355-361

2004-11-01(万方平台首次上网日期,不代表论文的发表时间)