汉语文本中事件之间时间关系分析试验研究
针对文本进行分析,抽取文本中的事件和时间,并建立事件之间的时间关系是对文本内容进行分析和时序挖掘的基础.本文基于ISO-TimeML标准进行汉语文本时间关系解析研究.本研究工作利用TimeBank语料库和前期构建的Chinese TimeBank语料库,对汉语文本中两个事件之间的时间关系进行识别与分析.实验结果显示,BEFORE、INCLUDES和SIMULTANEOUS3种时间关系识别效果较好.由于英汉语言结构的差异和数据集范围的限制,导致BEGINS和ENDS时间关系识别效果不是很理想.本研究工作是将TimeML与汉语语言相联系,验证了TimeML标准对汉语的适用性与处理能力,为汉语文本时间关系解析的深入研究奠定了基础.
汉语文本 时间关系 语料库 TimeML标准
李路标 张均胜 王惠临
电子工业出版社,北京 100036 中国科学技术信息研究所,北京 100038
国内会议
2016年中国科技信息资源管理与服务年会(COINFO2016)
北京
中文
82-96
2016-10-16(万方平台首次上网日期,不代表论文的发表时间)