支持向量机与Logistic回归分析对结肠腺瘤发生高级别上皮内瘤变预测的比较
目的:本研究分别应用SVM及Logistic回归分析对结肠腺瘤高级别上皮内瘤变的发生进行预测,并对两种方法进行比较。方法:1.病例来源:随机抽取2008~2010年我科行结肠息肉高频电凝切除术患者157例,男84例,女73例,年龄29~87岁,平均年龄(61.9±12.6)岁。2. logistic回归分析:全部157例病人数据采用SPSS 13.0统计软件进行统计学处理,对与高级别上皮内瘤变发生可能有关的12个因素进行logistic回归分析。3.支持向量机研究:本研究选用LIBSVM-2.88软件进行支持向量机分类。结果:1. SVM预测分类结果:应用50例作为训练集,建立预测模型,并对3个测试集分别进行预测,所得平均预测正确率为(92.6±3.3 )%,平均敏感度为( 80.6±17.3 )%,平均特异度为(94.8±0.6 )%。2. logistic回归预测分类结果首先应用单因素logistic回归模型分析将与高级别上皮内瘤变发生可能有关12个因素逐个引入logistic回归模型,在α=0.05水平上显示与高级别上皮内瘤变发生相关有显著意义的因素有2个,分别为病变发生的部位及病变大小。结论:本研究在训练集为50例的情况下SVM平均预测正确率92.6±3.3%,平均敏感度为80.6±17.3%,平均特异度为(94.8±0.6%,与Logistic回归概率预测效果相当甚至还略高。在医学研究中,有时取得足够的样本量并不是一件容易的事,特别是一些少见难治疾病,SVM为我们提供了一种新的方法,在小样本的情况下即可尝试开始进行预测,并在较少样本的情况下即有可能得到较好的预测结果。
支持向量机 Logistic回归分析 结肠腺瘤 上皮内瘤变 病情预测
张黎明 刘玉兰 朱元民
北京大学人民医院消化科
国内会议
北京
中文
206-207
2011-07-01(万方平台首次上网日期,不代表论文的发表时间)