基于自扩展的信息抽取模式自动获取
提出一种从未标注的中文文本中基于自扩展策略自动获取事件抽取模式的算法,该算法从少数几个种子抽取模式开始,通过一个增量迭代的过程发现新的抽取模式,在每一轮迭代中采用类似于TF/IDF的评估方法对产生的候选模式进行排序,选择最优的模式并入当前模式集.应用该方法从人民日报语料中自动获取”职务变动”类事件的抽取模式,实验结果表明,该方法产生的抽取模式在中文文本事件抽取中具有较好的抽取性能,综合指标F值达到66 3%.
信息抽取 抽取模式 自扩展 自动获取 中文文本
于江德 王立新 樊孝忠
安阳师范学院,计算机与信息工程学院,河南,安阳,455002 北京理工大学,计算机科学技术学院,北京,100081
国内会议
徐州
中文
891-894
2009-05-01(万方平台首次上网日期,不代表论文的发表时间)