会议专题

基于话题交叉回归的微博话题流行度预测方法

本文通过分析并利用不同话题之间的相关性提出话题交叉回归方法(Topic Cross Regression,TCR),该方法将话题的流行度序列建模为其他相关话题的流行度序列的线性回归函数.为获得相关话题集,TCR在回归分析前对话题流行度序列进行聚类.在TCR基础上提出两步预测法TCR+,第一步利用自回归方法预测相关话题的流行度,第二步基于相关话题流行度预测值利用TCR对当前话题的流行度进行预测.大量实验结果表明TCR和TCR+比传统方法取得了更好的预测效果,并发现聚类分析可有效消除流行度存在突变的话题给回归分析带来的干扰.

微博话题 流行度预测 聚类分析 交叉回归

段东圣 李鹏霄 佟玲玲 李玉华 李瑞轩

国家计算机网络应急技术处理协调中心,北京100029 华中科技大学计算机科学与技术学院,湖北武汉 430074

国内会议

2015中国计算机网络安全年会

武汉

中文

368-376

2015-05-26(万方平台首次上网日期,不代表论文的发表时间)