Qual é a importância da matriz de chapéu, , na análise de regressão?
É apenas para um cálculo mais fácil?
Qual é a importância da matriz de chapéu, , na análise de regressão?
É apenas para um cálculo mais fácil?
Respostas:
No estudo da regressão linear, o ponto de partida básico é o processo de geração de dados onde e determinístico. Depois de minimizar o critério dos mínimos quadrados, encontra-se um estimador para , ou seja, . Depois de conectar o estimador na fórmula inicial, obtém-se como um modelo linear do processo de geração de dados. Agora, pode-se substituir o estimador por e obterX B B B = ( X ' x ) - 1 X ' y y = X B B y = X ( X ' X ) - 1 X ' y .
Portanto, é na verdade uma matriz de projeção. Imagine que você pegue todas as variáveis em . As variáveis são vetores e ocupam um espaço. Portanto, se você multiplicar por , projeta seus valores observados em no espaço que é estendido pelas variáveis em . Ele fornece as estimativas para e essa é a razão pela qual é chamada de matriz de chapéu e por que tem tanta importância. Afinal, a regressão linear nada mais é do que uma projeção e com a matriz de projeção não podemos apenas calcular as estimativas paraX H y y X y y umas também para e pode, por exemplo, verificar se é realmente distribuído normalmente.
Encontrei essa bela foto na internet e visualiza essa projeção. Observe que é usado em vez de . Além disso, a figura enfatiza que o vetor dos termos de erro é ortogonal à projeção e, portanto, não está correlacionado com as estimativas paraB y
A matriz hat é muito útil por alguns motivos: