会议专题

基于语言学特征向量和词嵌入向量的汉语动词事件类型预测

本文主要介绍汉语动词事件类型的预测.事件类型是根据内部时间结构对汉语动词进行的重要分类,包括状态、活动、变化(完结和达成).对汉语动词事件类型进行预测从理论上能够对以往语言学研究提出的特征进行验证,从应用上可以服务于机器翻译等任务.本文基于两种方式构建词向量进行汉语动词事件类型的预测,一种是根据语言学特征有监督地构建词向量;另一种是利用word2vec无监督地构建词嵌入向量.通过多元逻辑回归、支持向量机和人工神经网络分类器对汉语动词事件类型进行预测,最终实现了73.6%的总体准确率.

汉语动词 事件类型 语言学特征 词嵌入 分类预测

刘洪超 黄居仁 侯仁魁 李洪政

香港理工大学中文及双语学系,香港 鲁东大学文学院,烟台,264001;香港理工大学中文及双语学系,香港 北京师范大学中文信息处理研究所,北京,100875

国内会议

第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会

南京

中文

1-11

2017-10-13(万方平台首次上网日期,不代表论文的发表时间)