基于欧拉超路的并行DNA序列拼接算法

摘要：

序列拼接是全基因组测序的核心问题之一.基于”overlap-layout-consensus”的传统拼接软件虽然被人们应用于人类基因组拼接等项目,但它们始终不能有效解决全基因组重复序列的拼接问题.为了克服上述不足,Pevzner等提出了欧拉超路拼接算法.该算法要求构造一个复杂的deBruijin图,用欧拉超路算法接接大规模全基因组存在存储瓶颈问题.本文对欧拉超路拼接算法中的存储瓶颈问题.测试结果表明,该并行算法具有良好的可扩展性,能够解决较大规模全基因组的序列拼接.

关键词：序列拼接欧拉超路并行拼接哈希表生物信息学

作者: 郑纬民林皎罗水华

作者单位: 教育部生物信息学重点实验室(北京);清华大学计算机科学与技术系(北京)

会议类型: 国内会议

会议名称: 2003中国计算机大会

会议地点: 北京

会议语种:中文

页码: 843-849

在线出版日期: 2003-11-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于欧拉超路的并行DNA序列拼接算法