会议专题

基于规则的时间规范化研究

时间的表示和时阃关系的计算是时间分析任务的关键和难点。其中不确定时间的规范化由于关系到不同语言之间时间共享,而且中文时间表达方式丰富多样,因此时间规范化是一个重要而又复杂的问题。针对这个问题,参考国际标准时间定义,重新定义了时间关系类型;然后参考TIMEX2标记规范,通过解析时间表达式内部规则,对时间短语的规范化技术进行了研究。实验结果表明:该方法可以较好地解决规则不完善导致准确率低以及近义词造成的工作量大的问题,在人民日报语料上取得的准确率为89.52% 。

时间关系 时间短语 近义词 短语规范化

温艳霞 谭红叶 郑家恒

山西大学计算机与信息技术学院 太原 030006 计算智能与中文信息处理教育部重点实验室 太原 030006

国内会议

2009国际信息技与应用论坛

成都

中文

389-391

2009-05-15(万方平台首次上网日期,不代表论文的发表时间)