会议专题

基于频繁传播模式的影响群落挖掘

  针对传统研究大多数基于影响个体挖掘,而忽略了影响群落的发现,本文考虑用户之间的频繁传播模式,提出了一种基于频繁传播模式的影响群落挖掘方法。针对群落内部传播模式的多样化,给出了一种信息传播树扩展方法,通过松弛信息传播树有向特性与图扩展方法,将信息传播树转换为连通无向无环图。最后结合支持度与影响强度,提出了一种新的频繁子图挖掘算法—Tribe-FGM,减小模式增长的规模,提高频繁子图挖掘效率。实验采用新浪微博真实数据,在约90万条博文以及对应约64万左右用户的“地震”话题与约31万条博文以及对应约21万左右用户的“两会”话题的数据集上验证算法的性能与有效性。结果表明Tribe-FGM算法压缩了图的规模,说明社会网络中仅存在少量影响力个体,大部分用户仅参与话题讨论,表现为较低的影响力,存在一种“长尾效应”。同时实验验证了Tribe-FGM算法的有效性,通过比较基于转发数影响个体挖掘方法的单步覆盖与多步覆盖,结果表明基于频繁传播模式的影响群落影响力强于基于转发数的影响个体。

social network frequent pattern influence tribe-leaders leaders

丁兆云 徐冰莹 邓镭 周斌 贾焰

国防科学技术大学计算机学院 长沙 410073

国内会议

第四届中国Agent理论与应用学术会议

长春

中文

1-8

2012-08-04(万方平台首次上网日期,不代表论文的发表时间)