会议专题

基于层次聚类算法的中文人名消歧研究

人名消歧是自然语言理解中的一个重要问题,该问题解决的好坏直接影响信息自动处理中的诸多问题。目前人名消歧研究多是针对英文进行的,本文针对中文人名消歧工作做了研究,通过实验提出了能够较好区分人名的特征。在特征权重的计算中,使用TF的计算方法,并通过构造识别人名的规则,提高了实验效果。在191个待消歧人名的测试中,实验最终取得了平均F值88.15%的较好效果。

层次聚类算法 中文人名 人名消歧 特征权重 人名识别

章顺瑞 游宏梁

中国国防科技信息中心 北京市190信箱,100142

国内会议

第二十四届全国计算机信息管理学术研讨会

南宁

中文

14-20

2010-11-01(万方平台首次上网日期,不代表论文的发表时间)