HNC语料库的作用
语料库作为自然语言处理及语言学其他分支学科的研究和实验对象,越来越受到重视。其实从揭示语言规律的角度看,语料一直受到研究者的重视。 随着计算机技术的发展与普及,获得并处理海量的语料已经变得简单容易了,语料库已经成为一种常规的工具。黄曾阳先生曾经形象地将语料库比喻为农业时代的耕地和工业时代的工厂。从语料库建设角度看,语料库的规模,静态或动态,平衡等方面无疑是重要的影响因素。然而从研究的角度讲,语料库所扮演的角色,所起的作用则更为重要。从语言研究的角度看,语料库经常被用来寻找和收集微观的语言现象,以语料库作为语言规律描写的起点,目前在词典编纂方面取得很好的结果。 而自然语言处理,需要使用语料库获取语言处理所需的知识,经常采取以统计为基础的处理方法,语料是统计的对象。语料库到底为我们提供什么样的知识? 自然语言处理是一个跨文理工学科的研究领域,它不仅需要有研究和实验的对象,更需要有理性的假设,以及对假设的验证与完善。基于这种认识,HNC认为语料库应当定位于:自然语言空间内各种现象的分布数据,辅助人激活概念联想脉络,理论及技术的验证。
概念层次网络 语料库 自然语言处理 熟语料
张全
中国科学院声学研究所,北京,100080
国内会议
北京
中文
289-295
2003-09-20(万方平台首次上网日期,不代表论文的发表时间)