国家语言资源监测语料库介绍
2005年,教育部语言文字信息管理司开始和国内若干高校陆续联合建设语言资源监测中心,其中包括与北京语言文化大学共建的平面媒体语言分中心、与中国传媒大学共建的有声媒体语言分中心、与华中师范大学共建的平面媒体语言分中心。这三个分中心分别建设了平面媒体动态流通语料库、有声媒体监测语料库、网络媒体监测语料库,它们共同构成国家语言资源监测语料库。语料库包括网页、纯文本,并采用中科院自动化所的自动分词工具做了自动分词。欢迎各界同仁共同开发、建设使用该语料库。
语料库 网络媒体 语言资源监测 自动分词
何婷婷 杨尔弘 侯敏
华中师范大学计算机科学系国家语言资源监测与研究中心网络媒体语言分中心 北京语言文化大学国家语言资源监测与研究中心平面媒体语言分中心 中国传媒大学国家语言资源监测与研究中心有声媒体语言分中心
国内会议
北京
中文
1-4
2008-11-24(万方平台首次上网日期,不代表论文的发表时间)