Vamos primeiro definir os seguintes objetos: Em um modelo estatístico usado para modelar como uma função de , existem parâmetros denotados por vetor . Esses parâmetros podem variar dentro do espaço de parâmetros . Não estamos interessados na estimativa de todos esses parâmetros, mas apenas de um determinado subconjunto, digamos em dos parâmetros que denotamos e que variam dentro do espaço de parâmetros . Em nosso modelo as variáveis e os parâmetrosMYXpθΘ⊂Rpq≤pθ0Θ0⊂RqMXθ vai agora ser mapeada como para explicar . Esse mapeamento é definido por e pelos parâmetros.YM
Nesse cenário, a identificabilidade diz algo sobre a Equivalência Observacional . Em particular, se os parâmetros forem identificáveis em então ele sustentará queθ0M∄θ1∈Θ0:θ1≠θ0,M(θ0)=M(θ1) . Em outras palavras, não existe um vector de parâmetros diferentes que iria induzir o mesmo processo de geração de dados, tendo em conta a especificação do modelo M . Para tornar esses conceitos mais concebíveis, dou dois exemplos.θ1M
Exemplo 1 : Defina para ; X ∼ N ( μ , σ 2 I n ) ; ε ~ N ( 0 , σ 2 e eu n ) o modelo estatístico simples H :
Y = um + X b + ε
e supor que ( a , b ) ∈ R 2 (de modo Θθ=(a,b)X∼N(μ,σ2In);ε∼N(0,σ2eIn)M
Y=a+Xb+ε
(a,b)∈R2 ). Fica claro que, se
θ 0 = ( a , b ) ou
θ 0 = a , sempre será válido que
θ 0 é identificável: O processo que gera
Y a partir de
X tem uma relação de
1 : 1 com os parâmetros
a e
b . Fixando
( a , b ) , não será possível encontrar uma segunda tupla em
R descrevendo o mesmo Processo de Geração de Dados.
Θ=R2θ0=(a,b)θ0=aθ0YX1:1ab(a,b)R
Exemplo 2 : Defina para ; X ∼ N ( μ , σ 2 I n ) ; ε ∼ N ( 0 , σ 2 e I n ) o modelo estatístico mais complicado M ′ :
Y = a + X ( bθ=(a,b,c)X∼N(μ,σ2In);ε∼N(0,σ2eIn)M′
e supor que(a,b)∈R2ec∈R∖{0}(modoΘ=R3∖{(l,m,0)|(l,m)∈R2}). Enquanto paraθ0, esse seria um modelo estatístico identificável, não será válido se um incluir outro parâmetro (isto é,b
Y=a+X(bc)+ε
(a,b)∈R2c∈R∖{0}Θ=R3∖{(l,m,0)|(l,m)∈R2}θ0bou
) Por quê? Porque para qualquer par de
( b , c ) , existem infinitamente muitos outros pares no conjunto
B : = { ( x , y ) | ( X / y ) = ( b / c ) , ( x , y ) ∈ R 2 } . A solução óbvia para o problema nesse caso seria a introdução de um novo parâmetro
d = b / cc(b,c)B:={(x,y)|(x/y)=(b/c),(x,y)∈R2}d=b/csubstituindo a fração para identificar o modelo. No entanto, pode-se estar interessado em
e
c como parâmetros separados por razões teóricas - os parâmetros podem corresponder aos parâmetros de interesse em uma (econômico) sentido teoria. (Por exemplo,
b pode ser 'propensão a consumir' e
c pode ser 'confiança', e você pode querer estimar essas duas quantidades a partir do seu modelo de regressão. Infelizmente, isso não seria possível.)
bcbc