实体关系的自动抽取研究
针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地设计了9个特征,尽可能全方位地描述文实体的真实情况.搭建了实验所需的系统框架,实现了实体关系的自动抽取.实验结果表明:该方法能够有效地解决实体关系的自动生成问题。
极大熵算法 Bootstrapping算法 特征选择 实体关系抽取 自动获取 标量聚类
张素香 文娟 秦颖 袁彩霞 钟义信
北京邮电大学,信息工程学院智能科学技术研究中心,100876,北京;华北电力大学,电子与通信工程系,河北,保定,071003 北京邮电大学,信息工程学院智能科学技术研究中心,100876,北京
国内会议
第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)
哈尔滨
中文
370-373
2006-08-05(万方平台首次上网日期,不代表论文的发表时间)