中文单字国名简称的自动识别
单字地名简称识别是中文专名识别的重要组成部分,其中单字国名简称又占到了单字地名简称的78.43﹪.但就现有的词性标注系统来看,还不能很好地对其进行识别.本文提出了一个基于规则的识别方法,以分词文本为底本,通过两次扫描,第一次扫描建立基于语篇的临时国名词表,第二次扫描利用上下文特征词等评分机制,从分词碎片中召回单字国名简称.在封闭测试和开放测试中,都取得了较好的实验结果,以人工分词文本为输入底本,调和平均值分别达到了96.33﹪和94.96﹪.
评分机制 临时词表 自动识别 中文专名 人工分词文本 中文信息处理
李斌
南京师范大学文学院(江苏南京)
国内会议
北京
中文
58-64
2004-08-01(万方平台首次上网日期,不代表论文的发表时间)