会议专题

基于网页上下文分析的图片检索

基于网页上下文分析的图片检索是指利用HTML文档源代码,通过分析文档结构自动获取图片的说明,并以此创建图片索引的一种图片检索方法.在本篇论文中我们提出了一种能更加有效的创建图片索引的新方法.本方法在传统的计算图片与文本的距离的方法的基础上提出了利用识别出的主要文本块和重复图片块来提高说明文字提取精度,将图片说明分为个别图片说明和公共图片说明,并识别图片与HTML文档标题之间的联系的新设想.经过试验验证该方法能够显著提高系统性能,精度和召回率由原来的57%和90%,提高到86%和95%.

图片检索 文本块 重复图片块 图片说明 网页检索

刘金松 于浩 西野文人

富士通研究开发中心(北京)

国内会议

全国第七届计算语言学联合学术会议

哈尔滨

中文

507-512

2003-08-01(万方平台首次上网日期,不代表论文的发表时间)