基于多种子联合共引的网络信息源自动发现技术
网络信息源自动发现技术是大数据时代海量网络信息获取的重要研究内容之一,本文提出一种基于多种子联合共引的网络信息源自动发现技术.首先选择某领域相关的若干网站作为种子信息源集合,然后提出一种基于多种子联合共引的相关网站挖掘算法,能够从因特网中自动挖掘出与种子信息源相关度高的网站,该类网站便是与种子信息源同领域的新信息源.实验证明通过本文技术能够得到大量高质量新信息源,抗噪声能力较强.
网络信息源 自动发现技术 多种子联合共引 挖掘算法 抗噪声性能
高辉 孙登峰 薛万鹏
中国国防科技信息中心 北京市190信箱6分箱,北京 100142
国内会议
吉林延吉
中文
1-5
2013-09-01(万方平台首次上网日期,不代表论文的发表时间)