鲁迅与冰心短篇小说计量风格分析
本文选用鲁迅的33篇小说与冰心的50篇小说为语料,通过对小说文本篇幅长度、平均段落长度、句长分布、词汇丰富度、标点使用的统计分析,发现鲁迅的小说篇幅长度变化大,平均段落与句子长度较短,词汇丰富度高;冰心小说反之.通过前1000个高频词的层次聚类实验发现,鲁迅小说多以乡土为背景,冰心小说多着眼于家庭.通过基于SVM的文本分类实验,发现冰心在小说历时创作的过程中,标点和词类的使用风格发生变化;鲁迅在不同题材小说的创作中,仅标点的使用风格变化较大,词类、二元标点以及二元词类的使用风格较为一致.
中文小说 计量风格 鲁迅 冰心
冷婷 刘颖
清华大学人文学院中国语言文学系,北京100084
国内会议
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
广州
中文
1-11
2015-11-13(万方平台首次上网日期,不代表论文的发表时间)