基于阈值自动发现的文章主题段划分

主题段划分是自动文摘系统中进行文章结构分析的重要环节.分析了当前主题段划分研究中存在的问题.提出了段落的主题相似度概念及其计算公式,公式结合了词的重复特性和段落距离特征.介绍了根据段落的主题相似度分布自动发现阈值的方法.实验结果表明,该方法对于文章主题段的划分准确率优于固定阈值选取的方法.
自动文摘 向量空间模型 段落相似度
索红光 刘玉树 聂坤明
国内会议
北京
中文
1122-1125
2006-12-22(万方平台首次上网日期,不代表论文的发表时间)
自动文摘 向量空间模型 段落相似度
索红光 刘玉树 聂坤明
国内会议
北京
中文
1122-1125
2006-12-22(万方平台首次上网日期,不代表论文的发表时间)