基于半贪心策略的特征子集选择算法
特征子集选择问题是指从一个给定的候选特征集合中,根据一定的评价标准,选出一个特征子集,使其能够一致地描述给定的例子集合.很明显通过特征子集选择,可以减少描述原数据集合的特征(属性)的数目,进而可以减少原数据集合的例子数.而在实际应用中,数据挖掘或模式识别所处理的对象是大型的数据库.其中每个记录都包含了许多特征(属性),由于在数据的采集过程中,可能会因为某些特征提取费用或设备和人为等原因,造成了属性集合中包含了一些未知的、无关的或冗余的特征(属性).这些特征(属性)的存在会给数据挖掘或模式识别算法带来很多麻烦.近年来,随着机器学习和数据挖掘在实际领域中的不断应用,特征子集选择算法研究逐渐成为人工智能领域的一个研究热点,因为通过特征子集选择。本文简介NFS算法和基于半贪心策略的特征子集选择算法。
半贪心策略 特征子集选择 候选特征集合 数据集合 人工智能 NFS算法
郭金喜 朱文兴
福州大学数学与计算机科学学院,福州,350002
国内会议
第六届中国Rough集与软计算学术研讨会(CRSSC”2006)
浙江金华
中文
139-142
2006-10-30(万方平台首次上网日期,不代表论文的发表时间)