有些天气不是我们想这么报,也不是数值模式说应该这么报,是领导(尤其是外行领导)要求我们这么报
比如数值模式预报明天是中雨,我们预报员分析订正后也认为是中雨,但领导说汛期了,要重视,要把量级调大,于是我们对外只好报了大雨甚至暴雨。而实际上,过几天来反查实况,实况就是只下了个中雨
大部分民众,和绝大部分领导,根本分不清暴雨和短时强降水。如果是10分钟内下了20mm的雨,从观感上确实是倾盆大雨,所以他们就会打电话骂我们,说都下暴雨了你们怎么什么事情都不做,预警也不发。而实际上,可能那一天也就下了这么10分钟的雨,以24小时标准论,就是个中雨
空报率与漏报率是气象行业中常用来评估预报模型性能的指标。评估指标的不同实质上反映了任务需求的不同,因此不同的指标在对同一预报模型进行评估时将会得到不同的结果。这就意味著预报模型的『好坏』往往是相对的,好的模型不仅取决于数据和演算法本身,还取决于是否契合实际问题需要。那么何时使用空报率,又何时使用漏报率呢?本篇将通过混淆矩阵逐步带大家了解精准度、查准率等多种评估指标,以此深入认识空报率与漏报率的含义,并提供场景实例让读者体会评估指标如何反映实际任务需求。(文末顺带提供混淆矩阵的python可视化代码方便大家使用。)
一、混淆矩阵
混淆矩阵也称误差矩阵,经常被用来对分类问题进行误差分析。为便于理解,我们以二分类预报——晴雨预报为例,将其所有可能出现的预报情形与实况结果两两进行交叉组合,得到如下四个基础项。
混淆矩阵的四个基础项
真正例(True Positive):预报有雨 实况有雨
真反例(True Negative):预报无雨 实况无雨
假正例(False Positive):预报有雨 实况无雨(纳伪,第二类错误)
假反例(False Negative):预报无雨 实况有雨(弃真,第一类错误)
将上述各项的计数以矩阵的方式呈现(其实就是一张表格啦),就得到了该预报模型的混淆矩阵。矩阵中的每一列代表预测类别,每列的数值和代表预报该类别的总次数;而每一行代表实况观测的类别,每行的数值和代表了该类别实况中出现的总次数。
晴雨预报的混淆矩阵