Como posso saber se um modelo estatístico é "identificado"?

Meu professor de econometria usou o termo "identificado" na aula. Estamos considerando processos de geração de dados no formato que é uma variável aleatória e é um termo de erro aleatório. Nossas linhas de regressão assumem a forma de

Y = β_{0} + β_{1} X + U

$Y = \beta_0 + \beta_1 X + U$

X

$X$

U

$U$

Y = \hat{β_{0}} + \hat{β_{1}} X

$Y = \hat{\beta_0}+\hat{\beta_1}X$

Ele deu a seguinte definição de "identificado":

$\beta_0$ , são identificados se um conjunto de dados contiver informações suficientes para "definir" valores únicos para , $\beta_1$ $\lbrace X_n\rbrace_{i=1}^{\infty}$ $\beta_0$ $\beta_1$

Estou insatisfeito com esta definição porque ele não especifica o que é "informação" nem o que "pin down" significa.

Um pouco de contexto

Em um de nossos exercícios, recebemos . Segundo meu professor, isso viola uma suposição chamada "Exogeneidade", necessária para que um modelo seja 'identificável'. $\Bbb E[UX] = \alpha \ne 0$

Especificamente, de acordo com suas notas de aula,

Exogeneidade Assunção: O termo de erro é não correlacionadas com os regressores, ou para todo . Assumindo , isso pode ser reescrito como para todos $\operatorname{Cov}(U_n,X_{nk}) = 0$ $k = 1,2,3...,K$ $\Bbb E(U_n|X_{n1},X_{n2},...,X_{nK})$
$Cov (U_{n}, X_{n k}) = E (U_{n} X_{n k}) = 0$ $\operatorname{Cov}(U_n,X_{nk}) = \Bbb E(U_nX_{nk}) =0$ $k = 1,2,3...,K$

Parece que no nosso problema, ele está tentando nos fazer entender por que, se essa suposição de Exogeneidade falha, um modelo não pode ser identificado. Portanto, esperamos que isso possa dar contexto aos respondentes sobre como ele está usando o termo.

Minha pergunta

Alguém pode esclarecer o que ele quer dizer com "informação" e "definir"? Ou dê uma definição melhor por completo.

EDITAR:

Retirado da Wikipedia:

Observacionalmente Equivalente --- dois valores de parâmetros são considerados observacionalmente equivalentes se ambos resultarem na mesma distribuição de probabilidade dos dados observáveis.

Identificado --- qualquer situação em que um modelo estatístico invariavelmente tenha mais de um conjunto de parâmetros que geram a mesma distribuição de observações, significando que várias parametrizações são observacionalmente equivalentes.

Isso ainda não explica realmente de onde vem a "exogeneidade" e por que está relacionada a ser "identificada".

— Stan Shunpike
fonte

Infelizmente, essa é uma definição vaga. Wikipedia para o resgate?

— shadowtalker

Relacionados: en.m.wikipedia.org/wiki/Observational_equivalence

— Stan Shunpike

@ssdecontrol Adicionei as definições, mas não tenho certeza de que seja realmente suficiente. Isso é mais uma afirmação qualitativa. Eu preferiria algo um pouco mais matemático.

— Stan Shunpike

O modelo de oferta e demanda que a Wikipedia dá demonstra exatamente o que você está perguntando sobre

— shadowtalker

Parece que vinculei a página errada, mas todos os comentários padrão sobre a pesquisa no Google se aplicam aqui: 1) en.m.wikipedia.org/wiki/Identifiability , 2) en.m.wikipedia.org/wiki/Parameter_identification_problem

— shadowtalker

Identificabilidade refere-se basicamente à existência ou não de estimadores consistentes para os parâmetros do modelo. Dito de outra forma, se nos dizem a distribuição dos dados, podemos recuperar os parâmetros do modelo? Caso contrário, nosso modelo não é identificável.

Talvez o exemplo mais simples de um modelo não identificável seja o modelo ANOVA super-parametrizado. Este modelo assume a forma

Y_{i j} = μ + α_{i} + ϵ_{i j}

$Y_{ij} = \mu + \alpha_i + \epsilon_{ij}$

onde e são constantes arbitrárias e normal . Se as informações que normal para alguns conjuntos de constantes e , e é importante observar que isso é tudo o que podemos aprender com os dados; então, não há uma maneira única de traduzir isso de volta para constantes , e . Isto é porque nós sempre pode tomar e $\mu$ $\{ \alpha_i \}_{i=1}^{k}$ $\epsilon_{ij} \sim$ $(0, \sigma^2)$ $Y_{ij} \sim$ $(\mu_i, \sigma^2)$ $\{ \mu_i \}_{i=1}^{k}$ $\sigma^2$ $\mu$ $\{ \alpha_i \}_{i=1}^{k}$ $\sigma^2$ $\mu + c$ $\alpha_i - c$ para chegar ao mesmo parâmetro médio para diferentes valores dos parâmetros do modelo. Mesmo se tivéssemos dados infinitos, nunca poderíamos esperar recuperar esses valores. Por esse motivo, impomos a restrição que garante um mapeamento um a um entre o modelo e os parâmetros de distribuição. $\mu_i = \mu + \alpha_i$ $\sum_{i=1}^{k} \alpha_i = 0$

— dsaxton
fonte