会议专题

基于hownet概念获取的中文自动文摘系统

本文首先基于hownet对多义词进行无导词语消歧处理,然后利用hownet建立的知识库获取文章中词语的概念,并对未登录词语进行概念标注.用概念统计代替传统的词形频率统计方法,选择出与主题相关的若干概念,建立主题概念向量空间模型;通过段落聚类的算法计算出段落重要度;利用段落重要度和主题概念向量空间模型计算出句子重要度,抽取文摘句.通过对抽取的语句进行句子相似度的计算来提高文摘精确度,设计并实现了一个中文自动文摘系统.

hownet 自动文摘 概念向量 概念获取 机械文摘

王萌 何婷婷 王晓荣

华中师范大学计算机科学系(武汉)

国内会议

第二届全国学生计算语言学研讨会

北京

中文

440-445

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)