会议专题

自适应主题融合的多文档自动摘要算法

在LDA主题模型的基础上,提出自适应主题融合的多文档自动摘要算法.考虑到标题信息对摘要形成有很强的指示作用,为文档的标题和正文内容分别建立主题模型,并对2个模型进行融合.融合过程中,根据2种形态的信息熵进行自适应不对称学习,从而对不同形态的主题分布进行加权处理.融合后的模型适当地关联了标题和正文的信息,因此能够有助于摘要质量的提高.实验结果表明:自适应主题融合的多文档自动摘要算法在DUC2002标准数据集上取得了较好的效果.

多文档摘要 主题模型 自适应调制 信息处理

刘娜 肖智博 路莹 唐晓君 肖鹏

大连工业大学信息科学与工程学院,辽宁大连,116034 大连海事大学信息科学技术学院,辽宁大连,116026

国内会议

2013年中国智能自动化会议

扬州

中文

205-209

2013-08-01(万方平台首次上网日期,不代表论文的发表时间)