会议专题

中英文混排文本字级索引的研究写实现

本文主要讨论全文检索技术中的索引问题.我们构筑的索引的最小索引单元对中文来说是汉字,对英文来说是单词,在本文中我们称之为“字级索引”.字级索引通过记录某个字出现的文档号列表以及在文档中出现的位置列表,对数据库的查询获得极快的查询速度和较高的查准率,并且更符合中文的查询.

索引 海量数据管理 全文检索系统 字级

王翼 马骏 孙良 孙康 陈根才

浙江大学计算机系(杭州)

国内会议

庆祝中国科技信息事业创建45周年学术研讨会

北京

中文

145-150

2001-10-01(万方平台首次上网日期,不代表论文的发表时间)