É sempre válido incluir uma interação bidirecional em um modelo sem incluir os efeitos principais? E se sua hipótese for apenas sobre a interação, você ainda precisa incluir os principais efeitos?
É sempre válido incluir uma interação bidirecional em um modelo sem incluir os efeitos principais? E se sua hipótese for apenas sobre a interação, você ainda precisa incluir os principais efeitos?
Respostas:
Na minha experiência, não só é necessário ter todos os efeitos de ordem inferior no modelo quando eles estão conectados aos efeitos de ordem superior, mas também é importante modelar adequadamente (por exemplo, permitindo que não seja linear) os principais efeitos aparentemente não relacionados a os fatores nas interações de interesse. Isso porque interações entre e pode ser stand-ins para efeitos principais de e . Às vezes, as interações parecem ser necessárias porque são colineares com variáveis omitidas ou termos não lineares omitidos (por exemplo, spline).x 2 x 3 x 4
Você pergunta se é alguma vez válido. Deixe-me fornecer um exemplo comum, cuja elucidação pode sugerir abordagens analíticas adicionais para você.
O exemplo mais simples de uma interação é um modelo com uma variável dependente e duas variáveis independentes X , Y na forma
com uma variável aleatória termo comportando zero expectativa, e utilizando parâmetros a- , β ' , γ ' , e δ ' . Vale a pena verificar se δ ′ se aproxima de β ′ γ ′ , porque uma expressão algebricamente equivalente do mesmo modelo é
(onde , etc).
Portanto, se há uma razão para supor , podemos absorvê-lo no termo de erro ε . Isso não apenas gera uma "interação pura", mas um termo constante. Por sua vez, isso sugere fortemente o uso de logaritmos. Alguma heterocedasticidade nos resíduos - isto é, uma tendência para os resíduos associados a valores maiores de Z serem maiores em valor absoluto que a média - também apontaria nessa direção. Gostaríamos, então, de explorar uma formulação alternativa
com erro aleatório iid . Além disso, se esperamos que β X e γ Y sejam grandes em comparação com 1 , em vez disso, apenas proporíamos o modelo
Este novo modelo possui apenas um único parâmetro vez de quatro parâmetros ( α , β ′ , etc.) sujeitos a uma relação quadrática ( δ ′ = β ′ γ ′ ), uma simplificação considerável.
Não estou dizendo que este é um passo necessário ou mesmo o único a ser dado, mas estou sugerindo que esse tipo de rearranjo algébrico do modelo geralmente vale a pena considerar sempre que as interações soarem significativas.
Algumas maneiras excelentes de explorar modelos com interação, especialmente com apenas duas e três variáveis independentes, aparecem nos capítulos 10 a 13 da EDA de Tukey .
Embora muitas vezes seja declarado nos livros didáticos que nunca se deve incluir uma interação em um modelo sem os principais efeitos correspondentes, certamente existem exemplos em que isso faria sentido. Vou te dar o exemplo mais simples que posso imaginar.
Suponha que os indivíduos aleatoriamente designados para dois grupos sejam medidos duas vezes, uma vez na linha de base (ou seja, logo após a randomização) e uma vez após o grupo T receber algum tipo de tratamento, enquanto o grupo C não. Então, um modelo de medidas repetidas para esses dados incluiria um efeito principal para a ocasião da medição (uma variável dummy que é 0 para a linha de base e 1 para o acompanhamento) e um termo de interação entre o dummy do grupo (0 para C, 1 para T ) e o tempo fictício.
A interceptação do modelo estima a pontuação média dos sujeitos na linha de base (independentemente do grupo em que se encontram). O coeficiente para o manequim da ocasião de medição indica a mudança no grupo de controle entre a linha de base e o acompanhamento. E o coeficiente para o termo de interação indica quanto maior / menor a alteração foi no grupo de tratamento em comparação ao grupo controle.
Aqui, não é necessário incluir o efeito principal do grupo, porque na linha de base, os grupos são equivalentes por definição devido à randomização.
Pode-se, é claro, argumentar que o principal efeito do grupo ainda deve ser incluído, de modo que, caso a randomização falhe, isso será revelado pela análise. No entanto, isso é equivalente a testar as médias de linha de base dos dois grupos uma contra a outra. E há muitas pessoas que desaprovam o teste quanto às diferenças de linha de base em estudos randomizados (é claro, também existem muitas que acham útil, mas essa é outra questão).
O motivo para manter os principais efeitos no modelo é a identificação. Portanto, se o objetivo é a inferência estatística sobre cada um dos efeitos, você deve manter os principais efeitos no modelo. No entanto, se seu objetivo de modelagem é apenas prever novos valores, é perfeitamente legítimo incluir apenas a interação, se isso melhorar a precisão preditiva.
isso está implícito em muitas das respostas que outros deram, mas o ponto simples é que os modelos com um termo de produto, mas sem o moderador e o preditor são apenas modelos diferentes. Descubra o que cada um significa, dado o processo que você está modelando e se um modelo sem o moderador e o preditor faz mais sentido, dada sua teoria ou hipótese. A observação de que o termo do produto é significativo, mas apenas quando o moderador e o preditor não estão incluídos, não informa nada (exceto talvez você esteja procurando "significado") sem uma explicação convincente de por que faz sentido deixá-los de fora .
Indiscutivelmente, isso depende do motivo pelo qual você está usando seu modelo. Mas nunca vi uma razão para não executar e descrever modelos com efeitos principais, mesmo nos casos em que a hipótese é apenas sobre a interação.
Emprestarei um parágrafo do livro Uma introdução à análise de sobrevivência usando Stata de M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko editado por Stata press para responder à sua pergunta.
É comum ler que os efeitos de interação devem ser incluídos no modelo somente quando os efeitos principais correspondentes também são incluídos, mas não há nada de errado em incluir os efeitos de interação por si mesmos. [...] O objetivo de um pesquisador é parametrizar o que é razoavelmente provável para os dados, considerando o problema em questão e não apenas seguindo uma prescrição.
Ambos x e y serão correlacionados com xy (a menos que você tenha tomado uma medida específica para evitar isso usando centragem). Portanto, se você obtiver um efeito de interação substancial com sua abordagem, provavelmente isso resultará em um ou mais efeitos principais que se disfarçam de interação. Isso não produzirá resultados claros e interpretáveis. O que é desejável é ver quanto a interação pode explicar além dos efeitos principais, incluindo x , y e (de preferência em uma etapa subsequente) xy .
Quanto à terminologia: sim, β 0 é chamado de "constante". Por outro lado, "parcial" tem significados específicos em regressão e, portanto, eu não usaria esse termo para descrever sua estratégia aqui.
Alguns exemplos interessantes que surgirão uma vez na lua azul são descritos neste tópico .
Eu sugeriria que é simplesmente um caso especial de incerteza de modelo. De uma perspectiva bayesiana, você simplesmente trata isso exatamente da mesma maneira que trataria qualquer outro tipo de incerteza:
E você pode ver a partir disso que é a "conclusão condicional" da hipótese sob o mésimo modelo (isso é geralmente tudo o que é considerado, para um "melhor" modelo escolhido ) Observe que essa análise padrão é justificada sempre que - um modelo "obviamente melhor" - ou sempre que - todos os modelos dão as mesmas / conclusões semelhantes. No entanto, se nenhum deles for atendido, o Teorema de Bayes diz que o melhor procedimento é calcular a média dos resultados, colocando pesos mais altos nos modelos mais suportados pelos dados e informações prévias.P ( M m | D I ) ≈ 1 P ( H i n t | D M j I ) ≈ P ( H i n t | D M k I )
Raramente é uma boa ideia incluir um termo de interação sem os principais efeitos envolvidos nele. David Rindskopf, do CCNY, escreveu alguns artigos sobre esses casos raros.
Existem vários processos na natureza que envolvem apenas um efeito de interação e leis que os descrevem. Por exemplo, a lei de Ohm. Na psicologia, você tem, por exemplo, o modelo de desempenho de Vroom (1964): Desempenho = Capacidade x Motivação. Agora, você pode esperar encontrar um efeito de interação significativo quando essa lei for verdadeira. Lamentavelmente, este não é o caso. Você pode facilmente encontrar dois efeitos principais e um efeito de interação insignificante (para uma demonstração e mais explicações, ver Landsheer, van den Wittenboer e Maassen (2006), Social Science Research 35, 274-294). O modelo linear não é muito adequado para detectar efeitos de interação; Ohm nunca poderia ter encontrado sua lei quando usara modelos lineares.
Como resultado, interpretar efeitos de interação em modelos lineares é difícil. Se você tem uma teoria que prevê um efeito de interação, inclua-a mesmo quando insignificante. Você pode querer ignorar os efeitos principais se sua teoria os excluir, mas você achará isso difícil, pois efeitos principais significativos são freqüentemente encontrados no caso de um verdadeiro mecanismo de geração de dados que possui apenas um efeito multiplicativo.
Minha resposta é: Sim, pode ser válido incluir uma interação bidirecional em um modelo sem incluir os efeitos principais. Os modelos lineares são excelentes ferramentas para aproximar os resultados de uma grande variedade de mecanismos de geração de dados, mas suas fórmulas não podem ser facilmente interpretadas como uma descrição válida do mecanismo de geração de dados.
Este é complicado e aconteceu comigo no meu último projeto. Eu explicaria da seguinte maneira: digamos que você tenha variáveis A e B que foram significativas de forma independente e, no sentido comercial, você pensou que uma interação de A e B parece boa. Você incluiu a interação que se mostrou significativa, mas B perdeu seu significado. Você explicaria seu modelo inicialmente mostrando dois resultados. Os resultados mostrariam que inicialmente B era significativo, mas quando visto à luz de A, perdeu o brilho. Então B é uma boa variável, mas somente quando vista à luz de vários níveis de A (se A for uma variável categórica). É como dizer que Obama é um bom líder quando visto à luz de seu exército SEAL. Portanto, o selo Obama * será uma variável significativa. Mas Obama, quando visto sozinho, pode não ser tão importante. (Sem ofensa a Obama, apenas um exemplo.)
F = m * a, força é igual a massa vezes a aceleração.
Não é representado como F = m + a + ma, ou alguma outra combinação linear desses parâmetros. De fato, apenas a interação entre massa e aceleração faria sentido fisicamente.
É sempre válido incluir uma interação bidirecional sem efeito principal?
Sim, pode ser válido e até necessário. Se, por exemplo, em 2. você incluir um fator para o efeito principal (diferença média da condição azul vs vermelho), isso pioraria o modelo.
E se sua hipótese for apenas sobre a interação, você ainda precisa incluir os principais efeitos?
Sua hipótese pode ser verdadeira independentemente de haver um efeito principal. Mas o modelo pode precisar dele para melhor descrever o processo subjacente. Então, sim, você deve tentar com e sem.
Nota: Você precisa centralizar o código para a variável independente "contínua" (medida no exemplo). Caso contrário, os coeficientes de interação no modelo não serão distribuídos simetricamente (nenhum coeficiente para a primeira medição no exemplo).
Se as variáveis em questão são categóricas, a inclusão de interações sem os principais efeitos é apenas uma reparameterização do modelo, e a escolha da parametrização depende do que você está tentando realizar com seu modelo. Interagir variáveis contínuas com outras variáveis contínuas ou com variáveis categóricas é uma história totalmente diferente. Veja: veja esta pergunta do Instituto de Pesquisa e Educação Digital da UCLA
Sim, isso pode ser válido, embora seja raro. Mas, neste caso, você ainda precisa modelar os principais efeitos, que posteriormente serão regredidos.
De fato, em alguns modelos, apenas a interação é interessante, como testes de drogas / modelos clínicos. Esta é, por exemplo, a base do modelo de Interações Psicofisiológicas Generalizadas (gPPI): y = ax + bxh + ch
onde x/y
estão os voxels / regiões de interesse e h
os projetos de blocos / eventos.
Neste modelo, ambos a
e c
serão regredidos, apenas b
serão mantidos para inferência (os coeficientes beta). Com efeito, tanto a
e c
representam atividade espúria no nosso caso, e só b
representa o que não pode ser explicado pela atividade espúria, a interação com a tarefa.
A resposta curta: se você incluir interação nos efeitos fixos, os efeitos principais serão incluídos automaticamente, independentemente de você os incluir ou não especificamente em seu código . A única diferença é a sua parametrização, ou seja, o que os parâmetros em seu modelo significam (por exemplo, eles são meios de grupo ou são diferenças dos níveis de referência).
Acabei de ver que David Beede deu uma resposta muito semelhante (desculpas), mas achei que deixaria isso para aqueles que respondem bem a uma perspectiva de álgebra linear.