Como outros observaram, isso pode ser modelado linearmente com uma interação. Você está interagindo com dois manequins, e não há nada de não linear nisso. Dado o modelo:
O efeito marginal 'gender' é a derivada parcial:
wt=α+b1age+b2gender+b3age∗gender+ϵ
∂wt∂gender=b2+b3age
Veja como se sexo e idade só podem assumir valores de 0 ou 1, estamos basicamente apenas observando a diferença de médias para quatro grupos diferentes? Ou seja, temos apenas as quatro combinações diferentes que podemos conectar nas equações acima: (1) e , (2) e , (3) e e (4) e . Portanto, seu exemplo específico é equivalente a uma comparação entre quatro médias de grupos.gender=0age=0gender=1age=1gender=0age=1gender=1age=0
Também pode ser útil ver esta discussão para entender como o acima é equivalente à ANOVA com duas variáveis nominais interagidas. Como outra maneira de reafirmar o fato de que, com seu exemplo específico, (novamente, porque existem apenas quatro combinações possíveis de idade e sexo), também poderíamos especificar um modelo como o seguinte, sem um termo explícito de interação:
wt=α+b1young.male+b2old.male+b3young.female+ϵ
Onde é omitido como sua categoria de referência e, por exemplo, o coeficiente será uma diferença nas médias entre e . Onde a interceptação também será igual à média de em (novamente, a categoria de referência).old.femaleb1old.femaleyoung.maleαwtold.female
Experimente com seus próprios dados. Com um modelo linear com uma interação, uma ANOVA com uma interação ou usando manequins para cada um dos grupos sem interação, você obterá os mesmos resultados. Muito legal, né? Um livro de estatística pode discutir cada um desses métodos em diferentes capítulos mas todos os caminhos levam a Roma. Realmente, ver como isso funciona com seus próprios dados é uma das melhores maneiras de aprender. …
Os exemplos acima são, portanto, uma maneira excessivamente complicada de chegar a essa conclusão (que estamos realmente apenas comparando quatro médias de grupo), mas para aprender sobre como as interações funcionam, acho que esse é um exercício útil. Existem outros posts muito bons no CV sobre a interação de uma variável contínua com uma variável nominal ou a interação de duas variáveis contínuas. Embora sua pergunta tenha sido editada para especificar testes não paramétricos, acho útil pensar no seu problema a partir de uma abordagem mais convencional (isto é, paramétrica), porque a maioria das abordagens não paramétricas ao teste de hipóteses tem a mesma lógica, mas geralmente com menos suposições sobre distribuições específicas.
Mas a pergunta pedia especificamente uma abordagem não paramétrica, que poderia ser mais apropriada, por exemplo, se não quiséssemos fazer certas suposições sobre a normalidade do . Um teste não paramétrico apropriado seria o teste de Dunn . Esse teste é semelhante ao teste de soma-rank de Wilcoxon-Mann-Whitney, mas com mais de duas categorias.wt
Outros testes de permutação também podem ser apropriados se você tiver uma diferença específica nos meios pelos quais está testando, por exemplo, vs. . Se vai ou não usar R, o pacote 'moeda' documenation fornece um resumo bem de diferentes testes não paramétricos, e em que circunstâncias estes testes pode ser apropriada. old.menyoung.women
Um breve resumo sobre interações "significativas"
Às vezes, você verá declarações como "a interação entre e foi estatisticamente significativa". Tais declarações não são necessariamente erradas, mas são enganosas. Geralmente, quando um autor escreve isso, eles estão dizendo que o coeficiente no termo de interação foi estatisticamente significativo. Mas este é um efeito incondicional em um modelo condicional . Um relatório mais preciso diria que " foi estatisticamente significativo em relação a 'alguns valores' de ", onde todas as outras covariáveis foram mantidas constantes em algum valor razoável, como média, mediana ou modo.x 2 x 1 x 2x1x2x1x2Mas, mais uma vez, se tivermos apenas duas covariáveis que só podem aceitar valores de 0 ou 1, isso significa que estamos olhando essencialmente para quatro médias de grupos.
Exemplo Trabalhado
Vamos comparar os resultados do modelo de interação com os resultados do teste de Dunn. Primeiro, vamos gerar alguns dados em que (a) homens pesam mais que mulheres, (b) homens mais jovens pesam menos que homens mais velhos e (c) não há diferença entre mulheres mais jovens e mais velhas.
set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))
Estime o modelo de interação e obtenha a previsão de partir do efeito marginal (com pacote de 'efeitos'). Veja aqui por que não queremos interpretar os efeitos incondicionais em um modelo como este. Em vez disso, queremos interpretar efeitos marginais. O modelo faz um trabalho decente ao detectar as diferenças que impusemos quando geramos nossos dados de exemplo.wt
mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)
model: wt ~ age * gender
age*gender effect
gender
age male female
old 80.61897 57.70635
young 67.78351 56.01228
Precisa calcular um erro padrão ou intervalo de confiança para o seu efeito marginal? O pacote de 'efeitos' mencionado acima pode fazer isso por você, mas melhor ainda, Aiken e West (1991) fornecem as fórmulas, mesmo para modelos de interação muito mais complicados. Suas tabelas são convenientemente impressas aqui , juntamente com ótimos comentários de Matt Golder.
Agora, para implementar o teste de Dunn.
#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")
Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0
Comparison of x by group
(Benjamini-Hochberg)
Col Mean-|
Row Mean | old.men young.me young.wo
---------+---------------------------------
young.me | 3.662802
| 0.0002*
|
young.wo | 7.185657 3.522855
| 0.0000* 0.0003*
|
old.wome | 6.705346 3.042544 -0.480310
| 0.0000* 0.0014* 0.3155
O valor de p no resultado do teste qui-quadrado de Kruskal-Wallis sugere que pelo menos um de nossos grupos 'vem de uma população diferente'. Para as comparações de grupo por grupo, o número superior é a estatística do teste z de Dunn e o número inferior é um valor p, que foi ajustado para várias comparações. Como nossos dados de exemplo foram bastante artificiais, não surpreende que tenhamos tantos pequenos valores de p. Mas observe a comparação inferior direita entre mulheres mais jovens e mais velhas. O teste suporta corretamente a hipótese nula de que não há diferença entre esses dois grupos.
Portanto, o modelo de interação e o teste de Dunn nos levam a conclusões semelhantes. Em todos os exemplos dados acima, estamos de alguma forma comparando médias de grupos. E, embora certamente haja abordagens mais diretas para comparar médias de grupos, tentei ilustrar como comparar médias de grupos também pode ser entendido como uma interação ou "efeito 2D", com algumas especificações de modelo, especificamente com interações nominais. Eu acho que entender isso é útil para entender modelos mais complicados com efeitos de interação. Vou vincular a este artigo mais uma vez, apenas porque acho que deve ser uma leitura obrigatória para quem trabalha com interações (há uma razão pela qual este artigo foi citado mais de 3 mil vezes ).…
ATUALIZAÇÃO: Dadas outras respostas, essa resposta foi atualizada para contestar a idéia de que isso requer qualquer forma de modelagem não linear ou que - dado o exemplo específico do OP de duas covariáveis binárias, ou seja, quatro grupos -, que deve haver um assinar mudança para avaliar isso de forma não paramétrica. Se a idade fosse contínua, por exemplo, haveria outras maneiras de abordar esse problema, mas esse não foi o exemplo dado pelo OP.