会议专题

基于网页内容的网站地理位置信息提取

随着互联网的快速发展,对网上信息的研究方兴未艾.其中,自动建立网站网址和其拥有所属地的对应关系是一项特别有意义的工作.本文通过总结网页中地址信息的出现规律,给出了一些自动识别地理位置的规则.利用这些规则,可以很方便地识别一个中文网页的所在地.同时,这些规则在实践中是很容易被扩充和完善的.同时我们对应用这些规则而得到的结果进行了检验,得到了令人满意的覆盖率和正确率.

网站地理位置 信息提取 关键字 规则

高朝华 郑璇 罗英伟 汪小林 许卓群

北京大学计算机科学技术系(北京)

国内会议

全国搜索引擎和网上信息挖掘学术讨论会

北京

中文

99-106

2003-03-01(万方平台首次上网日期,不代表论文的发表时间)