Você parece pensar que há um caso que mostra que a variação é maior que o MSE, mas está longe de ser claro como você está vendo isso. No aprendizado de máquina, Y é modelado como sendo igual a alguma função de X, mais um termo de erro aleatório. Esse erro é, como neste exemplo, geralmente representado com um épsilon,ϵ. Nesse modelo, uma função estimadora igual à dependência "real" de Y em X terá um MSE igual à variação deϵ. Um estimador que não seja a dependência "real" terá um MSE igual à variação deϵ, mais a variação entre a dependência "real" e o estimador usado. Assim, o MSE do estimador será maior ou igual à variânciado ---ϵ-. Pode ser, e qualquer estimador decente será, menor que a variaçãode Y----. Se o MSE de um estimador fosse maior que a variação de Y, ignorar X completamente e apenas prever que Y seria igual à média de Y seria um avaliador melhor.