基于相对邻域的特征基因选取

特征基因选择是分析基因表达数据的关键步骤.由于基因表达数据是连续型的数值,基于邻域的粗糙集的属性约简方法解决了经典粗糙集理论不能处理连续型数值的问题,但存在邻域参数选择缺乏支撑,参数一致造成的误差及构建样本邻域计算代价高等问题.基于此问题,提出一种新的基于相对邻域的粗糙集模型,通过刻画样本在值域区间上的相对位置确定相似样本并对论域进行划分.并在模型的基础上提出基于相对邻域的属性约简算法,该算法不仅适用于连续型数据且降低了计算样本邻域的复杂度.通过两个开放的基因表达数据库与其他算法进行对比,验证该算法是快速有效的。
数据库 特征基因选择 相对邻域 粗糙集 属性约简算法
张灵均 徐久成 高云鹏
河南师范大学计算机与信息技术学院,河南新乡,453007
国内会议
河南信阳
中文
21-26
2011-08-20(万方平台首次上网日期,不代表论文的发表时间)