会议专题

基于聚类和分类的金庸与古龙小说风格分析

本文以金庸与古龙的小说作为语料,从计算风格学的角度考察二人的风格差异.对比了两人小说的文本从众性、句子破碎度,同时,使用文本聚类的方法对词和词类的N元文法,标点符号的N元文法以及多种特征的总体情况进行了考察,还使用主成分分析和文本分类对八种特征从总体上进行了比较,结果证实金庸与古龙小说风格存在较大差异:金庸小说从众性大于古龙,较多使用俚语方言,口语性更强,同时在语法结构、短语结构、文本节奏以及文本可读性和语言变化程度也有较大的差异.

中文小说 句子破碎度 文本从众性 文本聚类 文本分类

肖天久 刘颖

清华大学中国语言文学系,北京,100084

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-12

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)