面向初学者的中文信息处理平台构建及应用

摘要：

随着大数据的趋势,越来越多的语言研究者开始关注和采用基于大规模语料的研究路线.但是,大部分语言学专业学生的统计知识基础相对薄弱,增加了他们在自然语言处理学习与应用方面的难度.因此,为了降低学习者对计算机与统计知识的陌生感,本文构建了一个用户友好的ICTCLAS分词/词性标注界面以及一个简单的基于N元语言模型的词串生成器.此平台为学习者提供了一个简易的中文文本处理手段,有利于他们理解统计语言模型的基本运作方式.

关键词：中文文本分词处理词串生成 N元模型

作者: 朴敏浚

作者单位: 北京大学中文系,北京100871

会议类型: 国内会议

会议名称: 第十届中文教学现代化国际研讨会

会议地点: 首尔

会议语种:中文

页码: 227-232

在线出版日期: 2016-08-13（万方平台首次上网日期，不代表论文的发表时间）

会议专题

面向初学者的中文信息处理平台构建及应用