基于依存分析和错误驱动的中文时间表达式识别
时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效果;然后,采用错误驱动学习来进一步增强识别效果,根据错误识别结果和人工标注的差异自动地获取和改进规则,使系统的性能又提高了近3.5%。最终在封闭测试集和开放测试集上,F1值达到了76.38%和76 57%。
时间表达式识别 触发词 依存分析 错误驱动学习 人工标注 封闭测试集
贺瑞芳 秦兵 刘挺 潘越群 李生
哈尔滨工业大学信息检索研究室 哈尔滨 150001
国内会议
大连
中文
102-107
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)