会议专题

新型DNA甲基化状态预测程序的研发和并行优化

已有的相关方法和软件在解决表观遗传学领域中DNA甲基化状态预测问题时,存在不准确、速度慢、时空效率低等问题.针对该问题设计并研发了新的甲基化状态预测程序(”Hint-Hunt”).新程序通过对含有辅助定位信息的甲基化序列进行最优相似比对,实现了对DNA甲基化状态的分析与预测,能够精准地给出参考序列中每个位点的甲基化状态数据.同时程序还实现了甲基化状态的假阳性识别、阈值过滤、最优筛选和得分共享机制等新功能.针对Hint-Hunt程序时空效率不高的问题,还面向天河2号高性能计算机研发了程序的并行版本(”P-Hint-Hunt”),P-Hint-Hunt程序采用任务和数据的细粒度划分以及OpenMP多线程方法对复杂大数据任务进行大规模并行处理,还设计了集中式循环IO方法和基于索引的多线程任务划分,避免由于程序频繁IO导致的额外开销.使计算任务负载均衡,进一步提高了并行效率.最后,还针对天河2系列超级超级计算机专有体系结构,CPU和Intel Xeon Phi协处理器的异构模式,实现了基于字节数的跨节点细粒度任务划分策略,保证了各节点的任务高效调度和负载均衡.实验表明,新型Hint-Hunt程序有效解决了DNA甲基化状态的分析与预测问题,P-Hint-Hunt程序并行加速效果明显,实现了多节点上多线程的两级并行结构,64线程加速比达到47倍.同时针对最新的Intel XeonPhi协处理器平台对程序进行了深度加速,加速比达到40倍,充分发挥了其众核优势.

脱氧核糖核酸 甲基化状态 预测程序 并行优化

高明 朱小谦 邹丹 朱敏 彭绍亮

国防科技大学 计算机学院 长沙 410073

国内会议

2014全国高性能计算学术年会

广州

中文

477-482

2014-11-06(万方平台首次上网日期,不代表论文的发表时间)