基于多源知识和Ranking SVM的中文微博命名实体链接
命名实体在文本中是承载信息的重要单元,正确分析存在歧义的命名实体,对文本的理解起到关键性作用.本文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本中抽取多种组合特征,利用Ranking SVM对候选实体集合进行排序,从而得到目标实体.在NLP&CC20141中文微博实体链接评测数据集上进行了实验,获得了89.40%的微平均准确率,与NLP&CC2014中文微博实体链接评测取得最好成绩的系统相比,本文的系统具有一定的优势.
中文文本 命名实体链接 多源知识 同义词词典 支持向量机
陈万礼 昝红英 吴泳钢
郑州大学信息工程学院,河南 郑州450001
国内会议
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
广州
中文
1-10
2015-11-13(万方平台首次上网日期,不代表论文的发表时间)