基于特征选择和语义扩展的词序列核函数研究
词序列核函数是Convolution核的一种,它处理的对象是离散的词序列.词序列核函数的计算过程不需要显式地构造特征向量,而且具有良好的复合特性,在自然语言处理领域有广泛的应用.传统的词序列核函数没有考虑到语义信息,本文对传统的词序列核函数加入了特征选择和语义扩展,得到一种新的核函数.本文使用该新函数进行实体关系自动抽取的实验,并与基于特征向量的方法和传统的词序列核函数作了比较.结果证明新函数的效果好于传统的方法,特别是在小规模训练集合上面具有较大的优势.
核方法 语义扩展 特征选择 词序列核函数
刘克彬 李芳 刘磊 韩颖
上海交通大学计算机科学与工程系,上海市,200240
国内会议
沈阳
中文
156-160
2006-08-15(万方平台首次上网日期,不代表论文的发表时间)