会议专题

文本信息抽取平台的设计与实现——基于机器学习

本文设计了一种可行的通用文本信息抽取平台的框架,使得用户可以在平台上轻易的针对不同数据集尝试不同机器学习算法进行信息抽取.按照该框架,我们开发了一个信息抽取平台原型:KEGSMART.它集成了”手工标注”,”抽取结果分析与比较”,”应用演示输出”三个可视化工具和”支持向量机”,”条件随机场”两种机器学习算法。两个抽取任务分别应用不同的算法在平台上实验,实验结果验证了该平台的实用性。

通用文本 信息抽取 机器学习算法 支持向量机 条件随机场

辛欣 李涓子

清华大学

国内会议

第七届中文信息处理国际会议

武汉

中文

328-334

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)