A cotação em bloco abaixo, dos líderes no campo da modelagem de efeitos mistos, afirma que as mudanças de coordenadas nos modelos com correlação zero entre efeitos aleatórios (modelos 'ZCP') alteram as previsões do modelo. Mas, alguém pode elaborar ou justificar ainda mais suas reivindicações?
As declarações em questão são do artigo de Bates et al., 2015 lme4
, Ajustando modelos de efeitos mistos lineares usando lme4 , página 7, segundo parágrafo ( link para download ).
Aqui está uma paráfrase do que eles escreveram:
Embora modelos de parâmetros de correlação zero sejam usados para reduzir a complexidade de modelos de pistas aleatórias, eles têm uma desvantagem. Modelos nos quais declives e interceptações têm correlação diferente de zero são invariantes a mudanças aditivas de um preditor contínuo.
Essa invariância é interrompida quando a correlação é restrita a zero; qualquer mudança no preditor necessariamente levará a uma mudança na correlação estimada e na probabilidade e previsões do modelo. 1 Por exemplo, podemos eliminar a correlação em fm1 simplesmente deslocando Dias [o preditor que acompanha ] por uma quantidade igual à razão dos desvios padrão estimados entre sujeitos, multiplicados pela correlação estimada, ou seja , 2 ,
Idealmente, o uso de tais modelos deve ser restrito aos casos em que o preditor é medido em uma escala de razão (ou seja, o ponto zero na escala é significativo, não apenas um local definido por conveniência ou convenção).
Questões:
Numerados de acordo com os sobrescritos acima ...
Eu posso ver que qualquer mudança no sistema de coordenadas pelo qual o preditor é medido levará a uma alteração na correlação estimada, levando a uma correlação diferente de zero. Isso apóia a afirmação de que os modelos de parâmetros de correlação zero não são invariantes em turnos nos sistemas de coordenadas preditivas e, portanto, que qualquer modelo com correlações de efeitos aleatórios diferentes de zero pode ser transformado em um modelo com correlações zero por uma mudança adequada nas coordenadas. Eu acho que ele também suporta o terceiro parágrafo da paráfrase acima: Os modelos ZCP (e modelos de interceptação zero - veja abaixo; mas por favor, verifique-me sobre isso ) são válidos apenas para modelos que utilizam certos sistemas de coordenadas especiais. Mas por que uma mudança de coordenada deve alterar as previsões para esses modelos?
Por exemplo, uma mudança nas coordenadas também mudará o termo de interceptação de efeito fixo para médias de grupo (veja abaixo), mas apenas em uma quantidade apropriada à mudança na origem do sistema de coordenadas do preditor. Essa mudança não afeta as previsões do modelo, desde que o novo sistema de coordenadas seja usado para o preditor alterado.
Para elaborar, se a inclinação de efeito fixo associada ao preditor alterado é positiva e a origem do sistema de coordenadas do preditor for alterada na direção negativa, a interceptação de efeito fixo diminuirá e qualquer interceptação aleatória de efeito associado também será alterada correspondentemente, refletindo a nova definição de 'origem' (e, portanto, interceptada) no sistema de coordenadas deslocadas. A propósito, acho que esse raciocínio também implica que um modelo de interceptação zero também não é invariável nessas mudanças.
Acho que tenho uma maneira razoável de resolver isso, mas obtive uma resposta um pouco diferente de Bates et al. Estou errado em algum lugar?
Abaixo está a minha resposta. A seguir, é apresentada a descrição de como cheguei ao meu resultado. Em resumo, acho que se eu mudar a origem negativamente por , para que no novo sistema de coordenadas o preditor assuma os valores , a correlação no novo sistema de coordenadas é zero se:δ > 0 x ′ = x + δ ρ ′
Isso difere do resultado de Bates et al .
Descrição do meu método (leitura opcional) : Digamos que temos a correlação de dois efeitos aleatórios, e ( para abreviar), ambos correspondentes ao mesmo fator de agrupamento com níveis (numerados por , variando de para ). Digamos também que o preditor contínuo com o qual a aleatória está emparelhada é chamado , definido de forma que o produto gere a contribuição condicional para o valor ajustado para o nívelinterceptar int k i 1 k declive x x x declive i y o b s i ρ x declivedo fator de agrupamento associado. Embora na realidade o algoritmo MLE determine o valor de para maximizar a probabilidade , eu esperaria que a expressão abaixo fosse uma maneira dimensionalmente correta de determinar os efeitos de uma tradução uniforme em , o multiplicador do efeito aleatório para .
Para chegar ao meu resultado, primeiro reescrevi o valor antigo da interceptação em termos de um novo valor para a interceptação, (aqui, , a' esquerda 'mudança de origem para o preditor ). Em seguida, substituí a expressão resultante no numerador da fórmula acima por , calculando o valor de que resultou em uma covariância zero no novo sistema de coordenadas. Observe que, conforme indicado na pergunta 1 acima, o termo de interceptação de efeito fixo também mudará de maneira análoga: . Aqui,δ > 0 x ρ δ β ′ 0 = - δ × β x + β 0 β x x .é o preditor de efeito fixo associado ao preditor deslocado)