一种基于Bootstrapping的本体学习方法
提出了一种基于自扩展的本体学习方法用于获取领域术语.该方法只需提供少量种子术语和一个未标注语料库作为输入,由种子术语开始学习抽取模式,再由学习到的模式发现新的术语,进一步由新发现的术语学习新的抽取模式,如此循环迭代.实验结果表明,该算法能够产生较高质量的领域术语集合和抽取模式集合,这样的集合可用于相关领域的信息抽取.
信息抽取 本体学习 自扩展 Bootstrapping 领域术语集合
张俊 高志强 徐惠 蔡施彦 戴云徽
东南大学,计算机科学与工程学院,江苏,南京,210096 东南大学,软件学院,江苏,南京,210096 南京理工大学,经济管理学院,江苏,南京,210094
国内会议
南京
中文
56-58
2008-11-14(万方平台首次上网日期,不代表论文的发表时间)