Cox e Wermuth (1996) ou Cox (1984) discutiram alguns métodos para detectar interações. O problema geralmente é o quão geral os termos de interação devem ser. Basicamente, (a) ajustamos (e testamos) todos os termos de interação de segunda ordem, um de cada vez, e (b) plotamos seus valores p correspondentes (isto é, os termos nº em função de ). A idéia é verificar se um certo número de termos de interação deve ser mantido: pressupondo que todos os termos de interação sejam nulos, a distribuição dos valores-p deve ser uniforme (ou equivalente, os pontos no gráfico de dispersão devem ser distribuídos aproximadamente uma linha que passa pela origem).1−p
Agora, como o @Gavin disse, ajustar muitas interações (se não todas) pode levar a sobreajuste, mas também é inútil em certo sentido (alguns termos de interação de alta ordem geralmente não têm sentido). No entanto, isso tem a ver com interpretação, não com a detecção de interações, e uma boa revisão já foi fornecida por Cox em Interpretação da interação: Uma revisão ( The Annals of Applied Statistics 2007, 1 (2), 371–385) - inclui referências citadas acima. Outras linhas de pesquisa que vale a pena examinar são o estudo de efeitos epistáticos em estudos genéticos, em particular métodos baseados em modelos gráficos (por exemplo, um método eficiente para identificar interatores estatísticos em redes de associação de genes ).
Referências
- Cox, DR e Wermuth, N (1996). Dependências multivariadas: Modelos, Análise e Interpretação . Chapman e Hall / CRC.
- Cox, DR (1984). Interação . International Statistical Review , 52, 1–31.