深度学习中汉语字向量和词向量结合方式探究

摘要：

本文旨在探究深度学习中汉语字向量和词向量的有效结合方式.以词作为基础语义单元和以字作为基础语义单元这两个方向进行探究,实验了字、词信息多种浅层结合方式和深层结合方式.为了验证提出的结合方式的有效性,改进了一种compare-aggregate模型,并在基于文档的问答系统上进行了实验.实验结果表明,有效的汉语字向量和词向量的结合方式超越了单独的字向量和词向量,提升了基于文档的问答系统的性能,使其结果与目前最好的结果可媲美.

关键词：深度学习字向量词向量问答系统

作者: 李伟康李炜吴云芳

作者单位: 北京大学计算语言学教育部重点实验室,北京市 100871

会议类型: 国内会议

会议名称: 第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会

会议地点: 南京

会议语种:中文

页码: 1-10

在线出版日期: 2017-10-13（万方平台首次上网日期，不代表论文的发表时间）

会议专题

深度学习中汉语字向量和词向量结合方式探究