交通工具名识别系统的设计与实现
交通工具名的正确识别对信息抽取、自动问答等信息处理任务意义重大。本文实现了一种基于Bootstrapping的交通工具名识别方法,其特点是:(1)通过手工标记小部分语料逐渐学习得到人量标注信息;(2)其中评价模式和样例时采用了计算信息熵增益的方法,更加精确的得到它们的度量方法。实验表明,该方法在交通工具名识别中是有效的。
文字处理 语义识别 信息熵增益 数理语言学
王振宇 谭红叶 郑家恒 张虎
山西大学计算机与信息技术学院,山西 太原 030006 计算智能与中文信息处理教育部重点实验室 山西 太原 030006 山西大学计算机与信息技术学院,山西 太原 030006 哈尔滨工业大学计算机科学与技术学院 黑龙江 哈尔 150001 计算智能与中文信息处理教育部重点实验室 山西 太原 030006
国内会议
太原
中文
351-356
2008-07-23(万方平台首次上网日期,不代表论文的发表时间)