会议专题

天河二号上基因组组装关键算法的性能建模

生物信息学的快速发展使得其所研究的生物体基因组规模越来越大,结构越来越复杂,这对如何快速进行基因组组装,获得准确完整的基因组序列提出了巨大的挑战.基因组组装中的线性化步骤耗时巨大,是计算密集型和内存访存密集型兼具的过程,本文研究了将随机List ranking算法应用于该线性化步骤的新型并行方法,对其基本原理进行了解释,并根据其具体实现方案,细致分析各个要点,设计了相当完备的通信消息量模型,非常准确的对通信模式进行了预测;接着通过引入LogGP模型,根据消息量模型的结果,对通信时间开销进行建模预测,成功的在定性层面上预测了通信时间开销的特点.本文说明,对随机算法进行具体细致的分析,重视算法中的关键因素,可以实现对随机算法的精细建模,准确地实现预测,获得更深层次的理解.

基因组组装 线性化步骤 并行计算 随机List ranking算法

叶志强 郭贵鑫 王丙强 彭绍亮 朱小谦

华大基因,深圳 518083 国防科学技术大学,长沙 410073

国内会议

2014全国高性能计算学术年会

广州

中文

135-144

2014-11-06(万方平台首次上网日期,不代表论文的发表时间)