会议专题

OpenBAS中EBLOB型文本数据全文检索的设计与实现

采用一种单字索引的汉字全文索引方法实现了对文本类型BLOB字段数据的全文检索。该方法避开了汉字自动分词这一难点,把文本中每一个汉字作为一个索引单位来对待,并不经过“停用词典”过滤直接登陆到索引文件中。检索时,检索词的选取完全由检索者控制,从而避免了索引与检索在选词上存在的差别,达到了索引与检索词选取的一致。由于该方法与西文索引与检索中按单词索引的方法相同,保证了中西文的兼容。并在参考ISO的SQL/MM的基础上,实现了在OpenBASE数据库SQL语句中对全文检索的支持。最后,讲述了系统的具体实现方法,体系结构和编程接口的使用。

全文检索 倒排索引 BLOB 单字标引

张谊岩 张霞

大学软件中心(辽宁沈阳)

国内会议

第十六届全国数据库学术会议

兰州

中文

435~440

1999-08-01(万方平台首次上网日期,不代表论文的发表时间)