一种优化的蛋白质序列模式挖掘方法
蛋白质序列作为生物序列数据一个重要组成部分,对其的分析研究已经成为生物信息学中的一个重要的研究方向和内容.通过对序列进行模式挖掘,可以对蛋白质序列或某一蛋白质家族序列进行研究,因此蛋白质序列的模式挖掘已经成为蛋白质序列研究中的一项重要任务.MBioPM是一种最新的生物序列模式挖掘算法,该算法通过引入模式划分概念,提高算法的效率,但该算法在效率方面仍存在不足,而且挖掘结果存在冗余性的问题.因此,提出一种优化算法BioPMMH,通过带有模式划分特点的Hash链表结构来优化算法中的搜索空间及策略,并在算法过程中对重复模式进行过滤.实验表明,算法BioPMMH能有效提高模式挖掘的效率,并解决结果的冗余性问题.
数据挖掘 蛋白质序列 模式挖掘 生物序列数据
李晟 姜青山 郭顺 王备战
厦门大学软件学院 福建厦门 361005 厦门大学软件学院 福建厦门 361005 成都大学 成都 610106
国内会议
南昌
中文
227-233
2009-10-15(万方平台首次上网日期,不代表论文的发表时间)