基于文本语义离散度的自动作文评分关键技术研究
本文尝试从文本语义离散度的角度去提升自动作文评分的效果,提出了两种文本语义离散度的表示方法,并给出了数学化的计算公式.基于现有的LDA模型、段落向量、词向量等具体方法,提取出四种表征文本语义离散度的实例,应用于自动作文评分.本文从统计学角度将文本语义离散度向量化,从去中心化的角度将文本语义离散度矩阵化,并使用多元线性回归、卷积神经网络和循环神经网络三种方法进行对比实验.实验结果表明:在50篇作文的验证集上,在加入文本语义离散度特征后,预测分数与真实分数之间均方根误差最大降低10.99%,皮尔逊相关系数最高提升2.7倍.该表示方法通用性强,没有语种限制,可以扩展到任何语言.
语文作文 自动评分 语义离散度 神经网络
王耀华 李舟军 巢文涵 何跃鹰 周建设
北京航空航天大学,北京100191 国家计算机网络应急技术处理协调中心,北京100029 首都师范大学成像技术高精尖创新中心 北京100048
国内会议
第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD-2016)
烟台
中文
1-11
2016-10-14(万方平台首次上网日期,不代表论文的发表时间)