双聚类算法在我国药品不良反应监测系统中的研究
目的:引入双聚类分析方法,探索适用于我国自发呈报系统数据分析的最优参数设置,识别出我国药品不良反应数据中具有相似性的信号组合,提高信号评价工作效率. 方法:本研究采用的信号挖掘方法为不相称测定方法中的信息成分法(IC).依据不同的IC阈值(0.05~4.00)将原始定量数据矩阵转化成80个0-1数据矩阵,并结合不同的Bimax算法参数(最小行数3、4、5,最小列数3、4、5,并两两组合共9种设置情况)对不同的0~1数据矩阵进行双聚类分析,得出不同阈值、不同算法参数设置下(共720种参数设置组合情况)双聚类分析结果.然后利用秩和比综合评价法结合平均符合比例、涉及比例两个指标对双聚类结果进行评价,确定最优参数.最后对最优参数组合设置下双聚类结果进行深入分析,明确双聚类算法在我国不良反应数据分析中的运用效果. 结果:通过秩和比综合评价法最终确定的最优区分强弱信号的阈值为IC=0.80,最优Bimax算法参数为双簇最小行数为3,最小列数为3.通过分类学评价发现所包含的药品具有相似性或所包含的不良反应具有相似性的双簇共有1836个,占双簇总数的42.8%,涉及72.3%的待评价信号. 结论:利用双聚类算法对我国药品不良反应数据进行分析,实现了从简单罗列的信号中提取有价值的信息并加以利用的完整流程,有助于促进我国药品不良反应信号评价工作效率的提高.
药品不良反应 自发呈报系统 最优参数设置 信号评价 双聚类分析
朱田田 张渊 吴桂芝 侯永芳 叶小飞 史文涛 许金芳 郭晓晶 韩贺东 王蒙 贺佳
第二军医大学,上海200433
国内会议
杭州
中文
5-9
2017-09-22(万方平台首次上网日期,不代表论文的发表时间)