会议专题

基于SVM和MMR 融和的自动文摘方法

  为了从文本中提取关键信息,需要对文本进行摘要。本文对文本句子提取多种类型的特征,采用支持向量机(SVM)计算样本在空间中的位置作为句子选为文摘句的置信度,从而能够根据实际需要按比例选取文摘句用于概括文本主要内容。 针对SVM方法在文摘句选取中的不足,本文引入基于最大边缘相关(MMR)的后处理方法,对于SVM难以区分类别的句子,综合其语义相关性以及冗余程度,进行二次筛选,从而构成最终的文摘。实验表明,SVM和MMR融合的引入提升了文摘句选取的性能。

文字处理 语句选择 语义分析 支持向量机

余骁捷 邵阳 吴及 王侠

清华大学 电子工程系,北京 100084

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-5

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)