Em 'The Elements of Statistical aprendizagem', a expressão para a decomposição de polarização-variância de-modelo linear é dada como
O termo variância está me incomodando aqui porque a equação implica que a variância seria zero se os alvos forem silenciosos, isto é,Mas não faz sentido para mim porque, mesmo com ruído zero, ainda posso obter estimadores diferentes para diferentes conjuntos de treinamento, o que implica que a variação é diferente de zero.
Por exemplo, suponha que a função alvo seja quadrática e os dados de treinamento contenham dois pontos amostrados aleatoriamente dessa quadrática; claramente, terei um ajuste linear diferente toda vez que amostrar dois pontos aleatoriamente do alvo quadrático. Então, como a variação pode ser zero?
Alguém pode me ajudar a descobrir o que há de errado na minha compreensão da decomposição da variação de polarização?