Intranet中Web对象的属性挖掘
随着互随着互联网的迅速发展,网络环境中的数据管理与挖掘成为研究热点.基于关键词的搜索引擎虽然获得巨大成功,仍无法满足人们的搜索需求.目前已有很多研究将网页中的文本信息进行更深一层的抽象,即对象化的抽象,然而由于Internet环境的复杂性,Web对象的信息通常难以挖掘整合.基于已有的Web框架,着眼于结构封闭性好,相关度高的intranet语料环境,将传统的面向对象的分析方式应用到Web对象建模的过程中,提出了一种Web对象的建模方法。在此基础上,给出了半监督的Web对象的属性挖掘方法。最后通过TREC会议的企业语料验证了该方法的有效性。
Web对象 属性挖掘 intranet 搜索引擎 对象化抽象
姚静 郑佳谦 徐隽 牛军钰
复旦大学计算机科学与工程系 上海 200433
国内会议
桂林
中文
514-519
2008-10-24(万方平台首次上网日期,不代表论文的发表时间)