基于SVM的多向量文本表示模型话题关联识别研究
本文在理论分析的基础上,并通过基准实验验证,提出一种多向量表示模型,该模型在尽量不丢失新闻报道信息的情况下,对特征集合尽可能细的划分,在模型比较时采用支持向量机对多个向量相似度进行整合.并在此基础上实现了话题发现与追踪中的话题关联识别系统。试验表明相对于基准系统,该系统的检测代价有明显降低,很大的提高了系统性能。
话题关联识别 文本表示 多向量表示模型 基准实验 特征集合划分
张晓艳 王挺 陈火旺
国防科技大学计算机学院,长沙,410073
国内会议
武汉
中文
390-395
2007-10-13(万方平台首次上网日期,不代表论文的发表时间)