基于《知网》的中文语块抽取器
我们根据”中文信息结构”的理论,以《知网》和《知网-中文信息结构库》为主要资源,开发了中文语块抽取器.本文简要的介绍了中文信息结构的理论,重点说明了中文语块抽取器的工作原理、过程、实现方法及其独有的特征.重点包括以下几个方面:切分、组词、消歧和中文语块抽取以及本系统重要的组成部分—信息结构解析器.中文语块抽取器将可用于中文文本的部分分析,计算机辅助的中文语块库的建设,结构和语义消歧,以及将可成为信息抽取(如实体、事件等)的工具.
语块 语块库 中文语块抽取 中文信息结构库
董强 郝长伶 董振东
中国科学院计算机语言信息工程研究中心(北京)
国内会议
哈尔滨
中文
234-239
2003-08-01(万方平台首次上网日期,不代表论文的发表时间)