中文单字国名简称的自动识别

摘要：

单字地名简称识别是中文专名识别的重要组成部分,其中单字国名简称又占到了单字地名简称的78.43﹪.但就现有的词性标注系统来看,还不能很好地对其进行识别.本文提出了一个基于规则的识别方法,以分词文本为底本,通过两次扫描,第一次扫描建立基于语篇的临时国名词表,第二次扫描利用上下文特征词等评分机制,从分词碎片中召回单字国名简称.在封闭测试和开放测试中,都取得了较好的实验结果,以人工分词文本为输入底本,调和平均值分别达到了96.33﹪和94.96﹪.

关键词：评分机制临时词表自动识别中文专名人工分词文本中文信息处理

作者: 李斌

作者单位: 南京师范大学文学院(江苏南京)

会议类型: 国内会议

会议名称: 第二届全国学生计算语言学研讨会

会议地点: 北京

会议语种:中文

页码: 58-64

在线出版日期: 2004-08-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

中文单字国名简称的自动识别