基于微博对话链的命名实体识别
伴随着因特网和信息产业的快速发展,微博已经成为一种新型的信息发布和传播的社交媒介,自然微博也为命名实体抽取提供了一个新的载体.本文针对微博数据的命名实体识别由于博文短小不足以提供抽取命名实体的足够信息的问题,提出一种基于微博对话链的中文微博命名实体识别方法.利用每条微博的评论扩充博文的上下文,选取词性、中国人名角色、地名角色、组织名角色4个特征,用条件随机场方法来抽取命名实体,主要识别博文中的人名、地名、组织名.在新浪微博数据上的实验结果表明该方法可以有效地提高微博中人名、地名、组织名的识别效果.
社交网络 命名实体 汉字识别 对话链
尉舒舒
国防科学技术大学,湖南,长沙,41000
国内会议
南昌
中文
1-5
2015-10-28(万方平台首次上网日期,不代表论文的发表时间)