基于网页内容的网站地理位置信息提取

摘要：

随着互联网的快速发展,对网上信息的研究方兴未艾.其中,自动建立网站网址和其拥有所属地的对应关系是一项特别有意义的工作.本文通过总结网页中地址信息的出现规律,给出了一些自动识别地理位置的规则.利用这些规则,可以很方便地识别一个中文网页的所在地.同时,这些规则在实践中是很容易被扩充和完善的.同时我们对应用这些规则而得到的结果进行了检验,得到了令人满意的覆盖率和正确率.

关键词：网站地理位置信息提取关键字规则

作者: 高朝华郑璇罗英伟汪小林许卓群

作者单位: 北京大学计算机科学技术系(北京)

会议类型: 国内会议

会议名称: 全国搜索引擎和网上信息挖掘学术讨论会

会议地点: 北京

会议语种:中文

页码: 99-106

在线出版日期: 2003-03-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于网页内容的网站地理位置信息提取