基于Bootstrapping的交通工具名识别
交通工具名的正确识别对信息抽取、自动问答等信息处理任务意义重大。为了解决获取标注语料困难这个问题,本文实现了一种基于Bootstrapping的交通工具名识别方法,其特点是:(1)通过手工标记小部分语料逐渐学习得到大量标注信息,(2)其中评价模式和样例时采用了计算信息熵增益的方法,以便更加精确地得到它们的度量方法。在ACE语料上进行测试,实验表明该方法在交通工具名识别中是有效的。
交通工具 信息熵增益 相似度计算 工具名识别 信息抽取 评价模式
王振宇 谭红叶 郑家恒
山西大学计算机与信息技术学院,太原 030006;计算智能与中文信息处理省部共建教育部重点实验室,太原 030006 山西大学计算机与信息技术学院,太原 030006;哈尔滨工业大学计算机科学与技术学院,哈尔滨 150001;计算智能与中文信息处理省部共建教育部重点实验室,太原 030006
国内会议
成都
中文
233-234,244
2008-04-01(万方平台首次上网日期,不代表论文的发表时间)