会议专题

面向初学者的中文信息处理平台构建及应用

随着大数据的趋势,越来越多的语言研究者开始关注和采用基于大规模语料的研究路线.但是,大部分语言学专业学生的统计知识基础相对薄弱,增加了他们在自然语言处理学习与应用方面的难度.因此,为了降低学习者对计算机与统计知识的陌生感,本文构建了一个用户友好的ICTCLAS分词/词性标注界面以及一个简单的基于N元语言模型的词串生成器.此平台为学习者提供了一个简易的中文文本处理手段,有利于他们理解统计语言模型的基本运作方式.

中文文本 分词处理 词串生成 N元模型

朴敏浚

北京大学中文系,北京100871

国内会议

第十届中文教学现代化国际研讨会

首尔

中文

227-232

2016-08-13(万方平台首次上网日期,不代表论文的发表时间)