会议专题

中文组织机构名自动分类

本文对组织机构名的自动分类问题进行了较深入的研究,并提出了三种分类方法.方法一将中文组织名的分类问题转化为序列标注问题,而后利用CRF标注其类别信息.方法二利用Liblinear对中文组织机构名进行分类.方法三选择归一化TF/IDF并利用简单的权值相加方法完成分类.实验结果表明,三种方法均获得了良好的分类精度,其中CRF的结果最好.对分类准确率的分析表明:中文组织机构名中大量的未登录词条是分类精度的瓶颈.

中文组织机构名 文本分类 分类精度 分类准确率

查道德 胡福乔

上海交通大学自动化系系统控制与信息处理教育部重点实验室,上海200240

国内会议

2013中国自动化学会华东六省一市年会(CETCU 2013)

威海

中文

88-92

2013-10-11(万方平台首次上网日期,不代表论文的发表时间)