<>常用度量–MAE(平均绝对误差)和RMSE(均方根误差)
MAE和RMSE是关于连续变量的两个最普遍的度量标准。
<>定义
1)我们看看最流行RMSE,全称是Root Mean Square Error,即均方根误差,它表示预测值和观测值之间差异(称为残差)的样本标准偏差。
均方根误差为了说明样本的离散程度。做非线性拟合时,RMSE越小越好。
标准差与均方根误差的区别:
标准差是用来衡量一组数自身的离散程度,而均方根误差是用来衡量观测值同真值之间的偏差,它们的研究对象和研究目的不同,但是计算过程类似。
例如:S={[(x1-x)2+(x2-x)2+…(xn-x)2]/N}
0.5(x为平均数,N为样本个数)此公式中的X也就是所谓的平均数应改为x’1,x’2…(即真实值)。均方根误差算的是观测值与其真值,或者观测值与其模拟值之间的偏差,而不是观测值与其平均值之间的偏差。
2)MAE,全称是Mean Absolute Error,即平均绝对误差,它表示预测值和观测值之间绝对误差的平均值。
MAE是一种线性分数,所有个体差异在平均值上的权重都相等,比如,10和0之间的绝对误差是5和0之间绝对误差的两倍。但这对于RMSE而言不一样,后续将进一步详细讨论。MAE很容易理解,因为它就是对残差直接计算平均,而RMSE相比MAE,会对高的差异惩罚更多。
<>实例讲解
让我们通过两个例子来理解一下:
案例1:真实值= [2,4,6,8],预测值= [4,6,8,10]
案例2:真实值= [2,4,6,8],预测值= [4,6,8,12]
案例1的MAE = 2.0,RMSE = 2.0
案例2的MAE = 2.5,RMSE = 2.65
从上述例子中,我们可以发现RMSE比MAE更加多地惩罚了最后一项预测值。通常,RMSE要大于或等于MAE。等于MAE的唯一情况是所有残差都相等或都为零
,如案例1中所有的预测值与真实值之间的残差皆为2,那么MAE和RMSE值就相等。
<>一般遵守的准则0
尽管RMSE更复杂且偏向更高的误差,它仍然是许多模型的默认度量标准,因为用RMSE来定义损失函数是平滑可微的,且更容易进行数学运算。
热门工具 换一换