会议专题

一种支持文本局部区域匹配的搜索引擎系统

  使用索引可以提高管理文本信息的效率,但传统的搜索引擎返回结果为文本全文,表示该单词包含在文本文件中,其语义较为模糊,从而降低了信息管理、信息提取的有效性。针对文本特定上下文区域进行检索,可以获得关健词相关的语义环境,从而更有效地管理文本信息。介绍了一种基于上下文索引的文本局部匹配搜索引擎,该引擎包含上下文提取语言、上下文索引、匹配算法等模块,可以在文本的特定范围内提取模式信息,同时支持索引的随机访问和匹配。最后,以从20 Newsgroups数据集中提取出组织名称、发件人,邮件主题等为例,演示本引擎的功能。

搜索引擎系统 优化设计 功能模块 文本局部匹配

Chen Min 陈旻 Jin Canghong 金苍宏 Wu Minghui 吴明晖 Ying Jing 应晶

College of Computer Science, Zhejiang University, Hangzhou 310007 浙江大学计算机学院 杭州 310007 College of Computer Science, Zhejiang University, Hangzhou 310007;Department of Computer Science and 浙江大学计算机学院 杭州 310007;浙江大学城市学院计算机科学与工程学系 杭州 310015

国内会议

第29届中国数据库学术会议

合肥

中文

382-386

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)