基于教务系统的站内搜索引擎研究与实现
随着互联网技术的发展,网络的触角蔓延到人类社会的方方面面,尤其是互联网成为人们获取信息的主要工具。与此同时互联网的信息量急剧膨胀,因此,从海量的数据中检索到自己所需要的信息成为人们不得不解决的问题,搜索引擎就是在这种状况下孕育而生的。Heritrix是一个开源的网络爬虫的架构,具有高度的可扩展性。Lucene是开源的全文检索工具包。基于Heritrix和Lucene实现一个站内搜索引擎,为用户提供灵活、高效、优质的检索服务完全可行。
教务系统 网络搜索 搜索引擎 网路爬虫 全文检索
郭鹤 鲍泓 梁军
北京联合大学信息学院 北京 100101 北京联合大学 北京 100101 北京联合大学电子信息技术实验实训基地 北京 100101
国内会议
中国计算机用户协会网络应用分会2011年第十五届网络新技术与应用年会
北京
中文
234-237
2011-10-30(万方平台首次上网日期,不代表论文的发表时间)