会议专题

中文信息处理开放平台的设计

我国的自然语言处理研究,在很大程度上处于一种低水平重复状态,由于缺乏一些公共的基础设施,很多研究工作都要花费大量的精力从底层模板做起,造成研究工作难以深入.本文提出,可以将开放式的开发模式应用于自然语言处理领域,并给出了一个面向中文的自然语言处理开放平台的设计.这个平台能够共享代码、语料、语言知识库等资源,并支持协作开发.这个平台的上层管理采用项目方式,实现了资源的重复利用.随着参与者的增多,和项目的发展,这个平台一定会为中文信息处理提供大量的资源.

开放源码 资源平台 自然语言处理 中文信息处理

刘群 北京大学计算语言学研究所(北京) 张浩 白硕

中国科学院计算技术研究所(北京) 国家计算机与网络信息安全管理中心(北京)

国内会议

第一届学生计算语言学研讨会

北京

中文

339-345

2002-08-01(万方平台首次上网日期,不代表论文的发表时间)