会议专题

基于《知网》的中文语块抽取器

我们根据”中文信息结构”的理论,以《知网》和《知网-中文信息结构库》为主要资源,开发了中文语块抽取器.本文简要的介绍了中文信息结构的理论,重点说明了中文语块抽取器的工作原理、过程、实现方法及其独有的特征.重点包括以下几个方面:切分、组词、消歧和中文语块抽取以及本系统重要的组成部分—信息结构解析器.中文语块抽取器将可用于中文文本的部分分析,计算机辅助的中文语块库的建设,结构和语义消歧,以及将可成为信息抽取(如实体、事件等)的工具.

语块 语块库 中文语块抽取 中文信息结构库

董强 郝长伶 董振东

中国科学院计算机语言信息工程研究中心(北京)

国内会议

全国第七届计算语言学联合学术会议

哈尔滨

中文

234-239

2003-08-01(万方平台首次上网日期,不代表论文的发表时间)