会议专题

基于FSVM层叠模型的中文命名实体识别

针对中文命名实体构成的复杂性,提出了一种基于模糊支持向量机的层叠模型。基于最长次长匹配一体化分词标注结果,在底层利用支持向量机基于单字特征进行人名、简单地名和机构名的识别;在高层回到词的层面,利用支持向量机基于词特征对复杂地名和机构名进行识别。通过基于单字和基于词的模糊支持向量机的结合,实现了对命名实体的一体化识别。模糊支持向量机的引入,降低了噪声样本和异常数据的影响,提高了系统识别精度。

中文命名实体 一体化识别 模糊支持向量机 层叠模型 自然语言处理

孙晓 黄德根

大连理工大学计算机科学与工程系,大连,辽宁,116023

国内会议

第七届中文信息处理国际会议

武汉

中文

396-401

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)