基于k-近邻法的雷暴预报
本文将模式识别方法中的k-近邻法应用在南京地区雷暴预报中,为雷暴预报提供新的预报方法。k- 近邻法目前已应用在了对降水、云量和温度等方面的研究,并取得了较好的预报效果。k-近邻法的基本思想是,大量历史样本集中的每个样本都作为一个模板,利用未知样本与每个模板做比较,找到最为相似(即为近邻)的k 个模板,根据这k 个模板的类别判断未知样本的类别,本研究将这一基本思想运用在对雷暴天气的识别中。首先,利用江苏省2008、2009 和2010 年6-8 月闪电定位资料确定雷暴过程,并利用同一时段的探空资料计算了47 个常用对流参数,分别分析了47 个参数与雷暴活动的相关性,筛选出17 个与雷暴相关性较好的对流参数(相关系数大于0.3)作为雷暴的预报因子。在此基础上,采用逐步选择法进一步筛选出大气可降水量pw、抬升指数li 、瑞士雷暴指数swiss 、低空3-6km 风速差63 SPD 、莱克力指数mj T 5 个预报因子。其次,将未知样本依据这5 个预报因子映射到一个5 维的空间中,利用欧氏距离法计算与未知样本最为相似的k 个近邻样本,并根据k 个样本的类别判断未知样本的类别。k 的取值应为奇数,从而避免出现两种类别个数相等时无法决策的情况。通过选取不同的k 值对历史样本进行预报,根据TS 技术评分结合虚警率和失误率选取最优的k 值。结果表明,当k 值为3 时,历史样本的预报技术评分TS 可达0.6759,并且虚警率和失误率最低。然后,通过独立样本检验k-近邻法的预报效果,在k 值为3 的情况下,雷暴预报的TS 技术评分为0.60,预报准确率为79.22%,失误率为21.79%,虚警率为19.73%。最后,将赵旭寰利用神经网络法和张祎利用支持向量机建立的雷暴预报模型的预报结果与本文利用k-近邻法建立的雷暴预报模型的预报效果进行了对比,结果表明,在TS 评分相当的情况下,k-近邻法与支持向量机相比具有较低的失误率和较高的击中率及预报准确率,而神经网络的失误率、击中率和预报准确率均优于k-近邻法,但神经网络具有较高的虚警率。由此可见k-近邻法对雷暴天气具有较好的预报效果。在下一步的研究中,可以考虑使用k-近邻法的衍生算法作为预报方法,并继续扩大样本,提高预测的准确性和增强模型的稳定性。
模式识别 k-近邻法 对流参数 雷暴预报
田琨 郭凤霞 杨宁
南京信息工程大学气象灾害省部共建教育部重点实验室,南京 210044 南京信息工程大学大气物理学院,南京 210044
国内会议
厦门
中文
1-8
2011-11-01(万方平台首次上网日期,不代表论文的发表时间)