知网在文本分割算法中的应用
文本分割在信息检索、信息获取、自动利用了文本表层的词汇重现信息,分割效果并不理想。本文在TextTiling算法的基础上,通过分析分割结果,发现仅利用词汇重现信息,难以准确体现主题的连续性。提出了利用知网引入词汇的语义信息,对传统的TextTiling算法进行了改进.实验结果表明,改进的TextTiling方法的召回率和准确率都有了明显提高。
文本分割 知网 TextTiling算法 语义信息
朱海军 张桂平 蔡东风 王炜华
沈阳航空工业学院知识工程中心,辽宁,沈阳,110034
国内会议
武汉
中文
448-453
2007-10-13(万方平台首次上网日期,不代表论文的发表时间)