语义网数据分析之初探
为了探索语义网的发展现状,用网络爬虫采集到9.859 636×106个语义网文档,构成数据集.针对该数据集,采用复杂网络分析方法,分析语义网文档的站点分布,语义网文档的大小分布,以及命名空间的使用情况等。实验结果表明:语义网文档的站点分布服从幂率分布,分布指数为0.5304;语义网文档大小的分布服从幂率分布,分布指数为1.4071;语义网文档的国家分布不均衡.与2年前比较,语义网文档数量成倍增长;语义网文档站点的分布指数由0.6515降为0.5304;语义网文档大小的分布指数由1.1833升为1.4071;命名空间的使用情况变化显著.
语义网 数据分析 幂率分布 命名空间
叶俊 瞿裕忠
东南大学计算机科学与工程学院,南京 211189
国内会议
南京
中文
301-307
2008-11-10(万方平台首次上网日期,不代表论文的发表时间)