会议专题

实体关系的自动抽取研究

针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地设计了9个特征,尽可能全方位地描述文实体的真实情况.搭建了实验所需的系统框架,实现了实体关系的自动抽取.实验结果表明:该方法能够有效地解决实体关系的自动生成问题。

极大熵算法 Bootstrapping算法 特征选择 实体关系抽取 自动获取 标量聚类

张素香 文娟 秦颖 袁彩霞 钟义信

北京邮电大学,信息工程学院智能科学技术研究中心,100876,北京;华北电力大学,电子与通信工程系,河北,保定,071003 北京邮电大学,信息工程学院智能科学技术研究中心,100876,北京

国内会议

第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)

哈尔滨

中文

370-373

2006-08-05(万方平台首次上网日期,不代表论文的发表时间)