会议专题

基于特征子集相关度和偏最小二乘法的特征选择策略

在中药方剂量-效关系的分析中,需寻找药理指标(因变量)受哪些血液指标(自变量)影响,问题归结在数据挖掘中是一个特征选择问题。本文提出一种基于特征子集相关度和偏最小二乘法的特征选择策略,利用特征子集相关度对药理指标进行评估预选出特征子集,然后将其放入偏最小二乘法中进行训练,利用训练后得出的残差平方和进行评估该特征子集是否可取,综合两者的评价进行分析药理指标受哪些血液指标的影响.通过将该特征选择策略与顺序前向浮动混合搜索策略和顺序后向浮动混合搜索策略进行结合,在中医药方剂数据麻杏石甘汤君药治疗咳嗽实验数据以及UCI数据集上进行对比验证,该特征选择策略能较好寻找一个较优的特征子集.

中药方剂 量效关系 数据挖掘 特征选择 偏最小二乘法 特征子集相关度

朱志鹏 杜建强 聂斌 喻芳 余日跃

江西中医药大学计算机学院 江西中医药大学药学院

国内会议

第五届中医药现代化国际科技大会

成都

中文

44-49

2016-10-23(万方平台首次上网日期,不代表论文的发表时间)