基于泛化和繁殖的自举式意见目标抽取方法
意见目标抽取是意见挖掘研究中的重要环节。现有方法的主要问题是将人工标注的意见目标直接视为”种子”进行意见目标扩展。本文提出了一种基于泛化、繁殖和自举的意见目标抽取方法,在泛化过程中提炼原子意见目标和意见目标模式,在繁殖过程中对复合意见目标进行扩展,并采取自举机制实现了意见目标的递增学习。实验结果显示,本文方法在自举过程的第一轮就在F-1分数上超出基线方法0.078;自举过程完成后,本文方法在F-1分数上提高了0.112。这说明,泛化处理对意见目标充分繁殖意义重大,自举过程则有助于充分发挥泛化能力和繁殖能力。
意见目标抽取 意见挖掘 自然语言处理 文本挖掘 泛化 繁殖过程
郝博一 夏云庆 邬晓钧 郑方 刘轶
清华大学大学信息技术研究院语音和语言技术中心,清华大学计算机系,北京 100086
国内会议
乌鲁木齐
中文
301-306
2009-08-14(万方平台首次上网日期,不代表论文的发表时间)