会议专题

基于半贪心策略的特征子集选择算法

特征子集选择问题是指从一个给定的候选特征集合中,根据一定的评价标准,选出一个特征子集,使其能够一致地描述给定的例子集合.很明显通过特征子集选择,可以减少描述原数据集合的特征(属性)的数目,进而可以减少原数据集合的例子数.而在实际应用中,数据挖掘或模式识别所处理的对象是大型的数据库.其中每个记录都包含了许多特征(属性),由于在数据的采集过程中,可能会因为某些特征提取费用或设备和人为等原因,造成了属性集合中包含了一些未知的、无关的或冗余的特征(属性).这些特征(属性)的存在会给数据挖掘或模式识别算法带来很多麻烦.近年来,随着机器学习和数据挖掘在实际领域中的不断应用,特征子集选择算法研究逐渐成为人工智能领域的一个研究热点,因为通过特征子集选择。本文简介NFS算法和基于半贪心策略的特征子集选择算法。

半贪心策略 特征子集选择 候选特征集合 数据集合 人工智能 NFS算法

郭金喜 朱文兴

福州大学数学与计算机科学学院,福州,350002

国内会议

第六届中国Rough集与软计算学术研讨会(CRSSC”2006)

浙江金华

中文

139-142

2006-10-30(万方平台首次上网日期,不代表论文的发表时间)