会议专题

基于转移学习的命名实体挖掘技术

本文研究了针对大规模查询日志中丰富的命名实体的挖掘技术。已有的研究工作提出了一种基于种子命名实体的弱指导框架,利用实体间的分布相似度来进行挖掘。区别于已有的方法,本文提出了一种新颖的基于转移学习的命名实体挖掘框架,该框架通过利用Wikipedia数据,结合转移学习的方法来构建目标类别的分类器,该方法很好地利用了监督学习的优越性能来提高查询日志中命名实体挖掘的准确性,同时也解决了监督学习方法中大规模标注的问题。实验结果表明基于转移学习的命名实体挖掘方法具有优越的命名实体挖掘性能。

转移学习 命名实体挖掘 正例学习

翟海军 郭勇 郭嘉丰 程学旗

中国科学技术大学计算机科学与技术学院,合肥,230027 中国科学院计算技术研究所,北京,100190 北京系统工程研究所,北京,100101 中国科学院计算技术研究所,北京,100190

国内会议

第五届全国信息检索学术会议CCIR2009

上海

中文

535-542

2009-11-14(万方平台首次上网日期,不代表论文的发表时间)