基于人物互斥属性的中文人名消歧
本文针对人名消歧任务中,由于歧义人名处于相近领域而区分困难的情况,提出了基于人物属性互斥与非互斥的两阶段人名消歧义方法。该方法的第一阶段,利用领域知识库和启发式规则抽取人物相关属性,包括职业领域、职务、相关实体等,利用这些属性进行人物的初步的聚合与划分,并识别出互斥与非互斥的人物;第二阶段则是在第一阶段的基础上,再进行一次基于主题聚类的人名消歧的过程,得到最终结果。在SIGHAN 2010训练数据上的对比实验中,本文提出的方法,较于单纯基于主题聚类算法的人名消歧,在Purity评价方法中,F 值平均提高了2个百分点,在B-Cubed 评价方法中,F值平均提高了3个百分点。
人名消歧 文本聚类 人物属性 人名互斥
周晓 李超 胡明涵 王会珍
东北大学自然语言处理实验室,沈阳,110004;医学影像计算教育部重点实验室(东北大学),辽宁沈阳,110819
国内会议
黑龙江镜泊湖
中文
333-340
2010-08-12(万方平台首次上网日期,不代表论文的发表时间)