会议专题

知网在文本分割算法中的应用

文本分割在信息检索、信息获取、自动利用了文本表层的词汇重现信息,分割效果并不理想。本文在TextTiling算法的基础上,通过分析分割结果,发现仅利用词汇重现信息,难以准确体现主题的连续性。提出了利用知网引入词汇的语义信息,对传统的TextTiling算法进行了改进.实验结果表明,改进的TextTiling方法的召回率和准确率都有了明显提高。

文本分割 知网 TextTiling算法 语义信息

朱海军 张桂平 蔡东风 王炜华

沈阳航空工业学院知识工程中心,辽宁,沈阳,110034

国内会议

第七届中文信息处理国际会议

武汉

中文

448-453

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)