会议专题

基于随机冲浪模型的XML文摘句子重排

在使用句子抽取的方法对多文档的XML文本进行文摘的过程中,必须通过对句子进行重排才能得到一个逻辑合理、内容连贯、可读性好的文摘.提出一种基于随机冲浪模型的方法对XML文摘进行句子重排.通过句子间的顺序关系(时间顺序、前后位置、句子所在文档树中的层次)和主题相关性关系的线性组合为边的权重,以句子为结点建立一个有向图,使用PageRank算法得到句子的分值并按该分值大小重排XML文摘中的句子.实验结果表明,模型能有效提高文摘内容的逻辑合理性、连贯性和可读性.

XML文摘 随机冲浪模型 顺序关系 句子重排 内容合理性

刘德喜 吴世汉 吴通

江西财经大学信息管理学院 南昌 330013 江西省高校数据与知识工程重点研究室 南昌 330013

国内会议

NDBC2009第26届中国数据库学术会议

南昌

中文

388-393

2009-10-15(万方平台首次上网日期,不代表论文的发表时间)