RMSE e MAE podem ter o mesmo valor?


9

Estou implementando validação cruzada e calculando métricas de erro como RMSE, , MAE, MSE, etc.R2

RMSE e MAE podem ter o mesmo valor?


11
Sim. Por que não? Seja sempre e um preditor de seja sempre . Aí está você0 X 1X0X1
David

Respostas:


17

Sim, em teoria. O caso mais simples que posso imaginar é um conjunto de dados em que todos os erros de previsão (ou seja, resíduos) são exatamente 1. O RMSE e o MAE retornarão valores idênticos de 1. É possível construir outros cenários também, mas nenhum parece muito provável.±

EDIT: Agradecemos a @DilipSarwate por apontar (mais elaborado por @ user20160 em sua excelente resposta) que esse resultado é possível se e somente se os valores absolutos de todos os erros de previsão forem idênticos. Não há nada de especial no valor 1 no meu exemplo, em outras palavras; qualquer outro número funcionaria em vez de 1.±


11
Você poderia dar um exemplo dos outros cenários que você imagina? Quero dizer um exemplo diferente de um múltiplo escalar (quando todos os resíduos são vez de ) do exemplo acima. ± 1±σ±1
Dilip Sarwate

@DilipSarwate Eu estava pensando nisso quando o user20160 adicionou uma resposta muito melhor que a aborda com mais detalhes do que eu poderia.
mkt - Restabelece Monica

11
@mkt Obrigado pelas amáveis ​​palavras. Sua resposta é correta e concisa (+1)
user20160

@DilipSarwate Obrigado pela contribuição
mkt - Reinstate Monica

11
Um par de adornos adicionais à sua resposta: (i) deve ser par (digamos ) e (ii) exatamente resíduos devem ter valor e exatamente resíduos devem ter valor , o que naturalmente significa que todos os resíduos têm valor absoluto como você afirma, mas (ii) garante que os resíduos sejam iguais a conforme necessário. Os resíduos são os desvios da média e, portanto, devem somar a zero. n = 2 k k + σ k - σ σ 0nn=2kk+σkσσ0
Dilip Sarwate

23

O erro absoluto médio (MAE) pode ser igual ao erro quadrático médio (MSE) ou erro quadrático médio da raiz (RMSE) sob certas condições, que mostrarei abaixo. É improvável que essas condições ocorram na prática.

Preliminares

Vamos ri=|yiy^i|denote o valor absoluto do residual para o i ésimo ponto de dados e seja um vetor que contém resíduos absolutos para todos os pontos no conjunto de dados. Permitindo denotar um vetor de um, o MAE, MSE e RMSE podem ser escritos como:r=[ri,,rn]Tn1n×1

(1)MAE=1n1TrMSE=1nrTrRMSE=1nrTr

MSE

Definir o MSE igual ao MAE e reorganizar fornece:

(2)(r1)Tr=0

O MSE e o MAE são iguais para todos os conjuntos de dados em que os resíduos absolutos resolvem a equação acima. Duas soluções óbvias são: (não há erro zero) (os resíduos são todos , como mkt mencionado). Mas, existem infinitas soluções.r=0r=1±1

Pode-se interpretar equação geometricamente como se segue: A LHS é o produto de ponto de e . O produto com ponto zero implica ortogonalidade. Portanto, o MSE e o MAE são iguais se a subtração de 1 de cada resíduo absoluto fornecer um vetor ortogonal aos resíduos absolutos originais.(2)r1r

Além disso, completando o quadrado, a equação pode ser reescrita como:(2)

(3)(r121)T(r121)=n4

Esta equação descreve uma esfera dimensional centrada em com raio . O MSE e o MAE são iguais se e somente se os resíduos absolutos estiverem na superfície dessa hiperesfera.n[12,,12]T12n

RMSE

Definir o RMSE igual ao MAE e reorganizar fornece:

(4)rTAr=0

A=(nI11T)

onde sou a matriz de identidade. O conjunto de soluções é o espaço nulo de ; isto é, o conjunto de todos os tais que . Para encontrar o espaço nulo, observe que é uma matriz com elementos diagonais iguais a e todos os outros elementos iguais a . A instrução corresponde ao sistema de equações:IA r A r = 0 A n × n n - 1 - 1 A r = 0ArAr=0An×nn11Ar=0

(5)(n1)rijirj=0i

Ou reorganizando as coisas:

(6)ri=1n1jirji

Ou seja, todo elemento deve ser igual à média dos outros elementos. A única maneira de satisfazer esse requisito é que todos os elementos sejam iguais (esse resultado também pode ser obtido considerando-se a composição automática de ). Portanto, o conjunto de soluções consiste em todos os vetores não negativos com entradas idênticas:riA

{rr=c1c0}

Portanto, o RMSE e o MAE são iguais se e somente se os valores absolutos dos resíduos forem iguais para todos os pontos de dados.


11
+1. Senti a necessidade de verificar se a maior parte dessa hiperesfera se encontra na região onde todos os componentes de são não negativos, o que é uma exigência de resíduos absolutos: isso me convenceu de que realmente existem muitas soluções (não triviais). r
whuber

+1 Ótima resposta!
mkt - Restabelece Monica

11
Na verdade, a questão era se RMSE e MAE podem ser iguais e não se MSE e MAE podem ser iguais. Talvez a resposta de @mkt (ou a versão generalizada que sugeri em um comentário) seja a única resposta para a pergunta RMSE = MAE?
Dilip Sarwate

@DilipSarwate, Sim, percebi depois de postar isso que eu pulei a parte 'R'. Eu editei para incluir o RMSE agora. Eu acredito que a versão que você sugeriu é a única resposta possível neste caso.
User20160 25/08/19

2
@Hiyam Se houver apenas 1 valor, o RMSE, por definição, deverá ser igual ao MAE. Como existe apenas 1 erro, o quadrado e a raiz são retornados apenas ao valor absoluto do erro original.
mkt - Restabelece Monica
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.