中文事件相关性语料库构建及识别方法
事件往往围绕主题展开,相互间存在相关性.在大数据时代,从海量信息中筛选出和某个主题相关的事件,有助于信息抽取、文本摘要、文本生成等自然语言处理任务.本文首先提出一种相关事件的标注方法,并标注了一个中文事件相关性语料库.然后,初步提出了一个基于多种特征的相关性事件识别方法.在标注语料上的实验表明,性能在基准系统上F1值提高了4.08%.
中文事件 语料库 识别方法 标注方法
黄一龙 李培峰 朱巧明
苏州大学计算机科学与技术学院,江苏苏州,215006;江苏省计算机信息处理技术重点实验室,江苏苏州,215006
国内会议
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
广州
中文
1-8
2015-11-13(万方平台首次上网日期,不代表论文的发表时间)