会议专题

交通工具名识别系统的设计与实现

交通工具名的正确识别对信息抽取、自动问答等信息处理任务意义重大。本文实现了一种基于Bootstrapping的交通工具名识别方法,其特点是:(1)通过手工标记小部分语料逐渐学习得到人量标注信息;(2)其中评价模式和样例时采用了计算信息熵增益的方法,更加精确的得到它们的度量方法。实验表明,该方法在交通工具名识别中是有效的。

文字处理 语义识别 信息熵增益 数理语言学

王振宇 谭红叶 郑家恒 张虎

山西大学计算机与信息技术学院,山西 太原 030006 计算智能与中文信息处理教育部重点实验室 山西 太原 030006 山西大学计算机与信息技术学院,山西 太原 030006 哈尔滨工业大学计算机科学与技术学院 黑龙江 哈尔 150001 计算智能与中文信息处理教育部重点实验室 山西 太原 030006

国内会议

第四届全国学生计算语言学研讨会(SWCL-2008)

太原

中文

351-356

2008-07-23(万方平台首次上网日期,不代表论文的发表时间)