肽鉴定结果评估模型的特征选择研究
在串联质谱鉴定中,高通量的数据库搜索和相似性比对会产生大量的鉴定结果.如何对这些结果进行定量的有效性评估是目前蛋白质组学研究的一个关键问题.从模式分类的角度看,该问题可以理解为根据比对打分特征对鉴定结果进行真阳性和假阳性两类的分类问题,在解决该问题的特征选择环节上提出了一系列新的反映串联质谱中离子碎裂规律的分类特征,然后使用支持向量机(SVM)对肽鉴定结果进行定量评估.对新增加的特征做了分类能力评估,并选取12个特征构建了新的SVM分类模型.实验表明使用了新的特征集合的分类模型可使用更少的特征数得到比前人工作更好的分类能力,并且新模型还能评估肽鉴定结果的可信度,用于进一步的蛋白质鉴定结果综合评价。
支持向量机 特征选择 肽序列鉴定验证 生物信息学 数据库搜索 蛋白质鉴定
李德泉 付岩 孙瑞祥 贺思敏 高文
中国科学院计算技术研究所数字化技术研究室,北京,100080;中国科学院研究生院,北京,100039 中国科学院计算技术研究所数字化技术研究室,北京,100080
国内会议
北京
中文
178-183
2005-09-23(万方平台首次上网日期,不代表论文的发表时间)