会议专题

面向安全事件新闻文本的时间抽取与转换

针对时间抽取的研究目前一般是基于时间抽取规范TIMEX2或TIMEX3采用规则或机器学习的方法进行处理,但是得到的时间信息缺少完全统一的形式,特别是在安全事件的舆情发现及分析等场景下很难直接利用.因此本文提出针对新闻中安全事件时间的信息抽取与转换方法,该方法首先对安全事件的新闻根据时间的分类分别对不同形式的时间进行抽取,然后利用六大时间转换算子及时间冲突处理算子输出其时间的年月日时分秒的统一格式.实验结果标明,采用该方法的抽取结果与使用条件随机场时间进行抽取结果上相差不大,并且在时间转换结果上的正确率可以得到90%以上.

新闻文本 安全事件 时间抽取 时间转换 正确率

李明月 王树鹏 王海平

中国科学院大学信息工程研究所,北京100093

国内会议

2015中国计算机网络安全年会

武汉

中文

454-459

2015-05-26(万方平台首次上网日期,不代表论文的发表时间)