会议专题

基于频繁模式的蛋白质序列分类

蛋白质序列的分类是预测新蛋白质序列的结构和功能的重要方法。已有的方法主要基于序列比对或概率后缀树。本文设计了一种基于频繁模式的蛋白质序列分类算法 CFS。我们使用每类数据独有的频繁模式代表该类,然后应用各类的频繁模式对测试数据进行分类。实验结果表明 CFS 方法在分类精确度方面优于目前公认最好的基于概率后缀树 PST 方法,而且在CFS 方法中每一类数据都是通过该类独有的频繁模式作为类代表,这样使得分类更直观,更易于理解,而且更具有生物信息学意义。

频繁模式 蛋白质序列 分类

黄金 张兆功 李建中

东北农业大学工程学院, 哈尔滨150030;黑龙江大学计算机科学技术学院, 哈尔滨150080 黑龙江大学计算机科学技术学院, 哈尔滨150080

国内会议

2005中国计算机大会

武汉

中文

2005-10-13(万方平台首次上网日期,不代表论文的发表时间)