会议专题

基于数字指纹的大规模DNA序列索引的永存方法

本文提出用分布查询,信息采集和永存索引的方式提高大规模生物数据查询的速度和完整性.1)永存索引和信息采集:为每条查询建立物化表,一般的DNA查询物化表遇到的问题在于:DNA查询串长度差别非常大,而且长度较长,这个长度在20~20K之间.这使得物化表的效率较低,而且需要的存储空间巨大,E.Hunt提出的Persistent Suffix Trees也存在这个问题.本文为解决这个问题,将DNA查询串进行信息摘要,获取其数字指纹.记录每个DNA查询串只需要16字节,而且长度固定.2)分布查询是将没有被物化表记录过的查询计划分解,使之成为在若干台计算机上,采用不同方式,对若干DNA部分的分布查询.

DNA序列 数据库 索引方法 数据查询 数字指纹

彭峰云 彭智勇

武汉大学软件工程国家重点实验室,武汉大学计算机学院(武汉)

国内会议

第二十届全国数据库学术会议

长沙

中文

530-532

2003-10-10(万方平台首次上网日期,不代表论文的发表时间)