融合实体特性的柬埔寨语命名实体识别方法

针对柬埔寨语命名实体的识别问题,提出一种在采用通用特征模板的基础上融合柬语实体特性的命名实体识别方法,对于时间、数字表达式等构成较固定的实体,通过人工制定规则进行识别;对于人名、地名、组织机构名等构成较复杂的实体,利用条件随机场学习算法,在采用词形、词性及其组合等特征之外,再将柬语实体的特有特性融入其中,构造复杂实体识别模型进行识别,实验表明,融合柬语实体特性的命名实体识别方法有较好的效果。
柬埔寨语 命名实体识别 规则 条件随机场 实体特性
潘华山 严馨 余正涛 郭剑毅
昆明理工大学信息工程与自动化学院,昆明650500;昆明理工大学智能信息处理重点实验室,昆明650500
国际会议
长沙
中文
4003-4007
2014-05-31(万方平台首次上网日期,不代表论文的发表时间)