中文信息处理开放平台的设计
我国的自然语言处理研究,在很大程度上处于一种低水平重复状态,由于缺乏一些公共的基础设施,很多研究工作都要花费大量的精力从底层模板做起,造成研究工作难以深入.本文提出,可以将开放式的开发模式应用于自然语言处理领域,并给出了一个面向中文的自然语言处理开放平台的设计.这个平台能够共享代码、语料、语言知识库等资源,并支持协作开发.这个平台的上层管理采用项目方式,实现了资源的重复利用.随着参与者的增多,和项目的发展,这个平台一定会为中文信息处理提供大量的资源.
开放源码 资源平台 自然语言处理 中文信息处理
刘群 北京大学计算语言学研究所(北京) 张浩 白硕
中国科学院计算技术研究所(北京) 国家计算机与网络信息安全管理中心(北京)
国内会议
北京
中文
339-345
2002-08-01(万方平台首次上网日期,不代表论文的发表时间)