基于词汇等级的汉语作文自动评分技术
作文是汉语考试的必考项目,寻找简单有效的作文自动评分算法无疑可以很大地提高作文阅卷的效率。本文在词汇等级方面研究作文自动评分技术,包括采用现成的分级词汇表方法,以及两种本文提出的词汇等级训练算法,实验结果表明,基于现成的分级词汇表法的作文打分结果与人工打分相关性较差,本文提出的两种词汇等级训练算法打分结果的相关性指标分别接近人的水平和超过人的水平。这表明,作文的用词随着作文题目的变化而变化,固定的分级词汇表不能反映学生作文水平;但针对同一个题目的具体作文而言,其用词与作文水平有强相关性。
汉字处理 作文评分 词汇分析 数理语言学
柯登峰 彭星源 赵知 陈振标 王士进 徐波
中国科学院自动化研究所 北京 100190
国内会议
西安
中文
1-5
2011-10-16(万方平台首次上网日期,不代表论文的发表时间)