Abordagem de média do modelo - estimativas do coeficiente médio versus previsões do modelo?

Eu tenho uma pergunta básica sobre abordagens para modelar a média usando critérios de TI para ponderar modelos em um conjunto de candidatos.

A maioria das fontes que li sobre a média do modelo defende a média das estimativas do coeficiente de parâmetros com base nos pesos do modelo (usando um método de 'média natural' ou 'média zero'). No entanto, tive a impressão de que calcular a média e ponderar as previsões de cada modelo , em vez das estimativas do coeficiente de parâmetros, com base nos pesos do modelo, é uma abordagem mais direta e justificada, principalmente se comparar modelos com variáveis preditivas não aninhadas.

Existe uma orientação clara sobre qual abordagem para a média do modelo é mais justificada (média das estimativas ponderadas dos parâmetros x previsões ponderadas)? Além disso, existem outras complicações com a média do modelo das estimativas do coeficiente no caso de modelos mistos?

mixed-model model-averaging forecast-combination

— John Stella
fonte

Ambas as abordagens são possíveis. A principal vantagem da média de previsões é que você pode calcular a média sobre qualquer tipo de modelo.

— Tim

Talvez de interesse: "Modelo de média em ecologia: uma revisão das abordagens bayesianas, teóricas da informação e táticas para inferência preditiva" esajournals.onlinelibrary.wiley.com/doi/10.1002/ecm.1309

— Florian Hartig

Nos modelos lineares, a média dos coeficientes fornecerá os mesmos valores previstos que os valores previstos da média das previsões, mas transmite mais informações. Muitas exposições lidam com modelos lineares e, portanto, são médios entre os coeficientes.

Você pode verificar a equivalência com um pouco de álgebra linear. Digamos que você tenha observações e preditores. Você reúne o último na matriz . Você também tem modelos , cada um dos quais atribui uma estimativa de coeficiente aos preditores. Empilhe essas estimativas de coeficiente na matriz . Média significa que você atribui pesos a cada modelo (os pesos geralmente não são negativos e somam um). Colocar estes pesos no vector de comprimento . $T$ $N$ $T\times N$ $\mathbf{X}$ $M$ $\beta_m$ $N$ $N \times M$ $\mathbf{\beta}$ $w_m$ $m$ $\mathbf{w}$ $M$

Os valores previstos para cada modelo são dados por ou, na notação empilhada Os valores previstos da média das previsões são dados por Quando você calcula a média estimativas de coeficiente, você calcula E os valores previstos dos coeficientes médios são dados por $\mathbf{\hat{y}}_m = \mathbf{X}\beta_m$

\hat{y} = X β

$\mathbf{\hat{y}} = \mathbf{X}\mathbf{\beta}$

\hat{y} w = (X β) w

$\mathbf{\hat{y}} \mathbf{w} = (\mathbf{X}\mathbf{\beta})\mathbf{w}$

β_{w} = β w

$\mathbf{\beta}_w = \mathbf{\beta}\mathbf{w}$

{X β}_{w} = X (β w)

$\mathbf{X\beta}_w = \mathbf{X}(\mathbf{\beta}\mathbf{w})$ A equivalência entre os valores previstos para qualquer uma das abordagens decorre da associatividade do produto da matriz. Como os valores previstos são os mesmos, você também pode calcular a média dos coeficientes: isso fornece mais informações, caso você queira, por exemplo, procurar coeficientes para preditores individuais.

Nos modelos não lineares, a equivalência normalmente não se mantém mais e, aliás, faz sentido fazer a média das previsões. A vasta literatura sobre a média das previsões (combinações de previsão) é, por exemplo, resumida aqui .

— Matthias Schmidtblaicher
fonte

"pelo menos em modelos lineares" - que tal apenas em modelos lineares ?!

— Hao Ye

É um argumento "se", não "apenas se", então acho a expressão "pelo menos" precisa.

— Matthias Schmidtblaicher 6/11

Ainda assim, eu obter o seu ponto e modificou a minha resposta @HaoYe

— Matthias Schmidtblaicher