会议专题

EIF:一种基于关系的实体识别框架

在很多现实世界的应用中名字和实体间存在冲突,也就是说,不同的人或事物可能拥有同一个名字,同一个人或事物也可能用不同的名字指代.识别名字指代的实体是数据清洗和实体查询中的重要问题。当前的方法仅能够处理某种单一情况下的冲突,并不能解决现实应用中实体识别的问题。针对这些问题,本文提出了一种普遍适用的基于关系的实体识别框架EIF,这个框架扩展并应用领域知识和聚类技术求解实体识删问题。本文还将该框架应用于求解丈献中的作者实体识别问题,提出了作者识别算法。并通过实验对该框架的有效性进行了验证。

实体识别 数据清洗算法 聚类技术 名字指代 实体查询

黎玲利 王宏志 高宏 李建中

哈尔滨工业大学 计算机科学与技术,黑龙江 哈尔滨市 150001

国内会议

2009中国计算机大会

天津

中文

622-630

2009-10-23(万方平台首次上网日期,不代表论文的发表时间)