基于欧拉超路的并行DNA序列拼接算法
序列拼接是全基因组测序的核心问题之一.基于”overlap-layout-consensus”的传统拼接软件虽然被人们应用于人类基因组拼接等项目,但它们始终不能有效解决全基因组重复序列的拼接问题.为了克服上述不足,Pevzner等提出了欧拉超路拼接算法.该算法要求构造一个复杂的deBruijin图,用欧拉超路算法接接大规模全基因组存在存储瓶颈问题.本文对欧拉超路拼接算法中的存储瓶颈问题.测试结果表明,该并行算法具有良好的可扩展性,能够解决较大规模全基因组的序列拼接.
序列拼接 欧拉超路 并行拼接 哈希表 生物信息学
郑纬民 林皎 罗水华
教育部生物信息学重点实验室(北京);清华大学计算机科学与技术系(北京)
国内会议
北京
中文
843-849
2003-11-01(万方平台首次上网日期,不代表论文的发表时间)