Digamos que temos os seguintes dados:
set.seed(123)
data <- data.frame(x = c(rnorm(50, 1, 1), rnorm(50, 5, 2)),
y = c(rep('A', 50), rep('B', 50)))
Qual produz o seguinte boxplot ( boxplot(data$x ~ data$y)
):
Agora, digamos que eu queira testar se as duas amostras têm os mesmos parâmetros de localização (mediana e / ou média). No meu caso real, os dados claramente não são normais , então decidi executar o teste de Wilcoxon-Mann-Whitney, assim:
wilcox.test(data$x ~ data$y)
No entanto, eu gostaria que a hipótese alternativa fosse que data$y
o "segundo" fator de B venha de uma distribuição com parâmetros de posição mais altos. Eu tentei definir o alternative
parâmetro como "maior" e "menor", mas aparentemente as hipóteses alternativas não são o que estou procurando. Por exemplo, alternative = "greater"
me diz "hipótese alternativa: a verdadeira mudança de local é maior que 0"; alternative = "less"
diz-me "hipótese alternativa: a verdadeira mudança de local é menor que 0".
Como posso ajustar a wilcox.test()
função para ter a hipótese alternativa que eu quero (B vem de uma distribuição com parâmetros de posição mais altos que A)? Ou devo apenas usar outro teste?
rnorm()
, portanto eles devem ser normais . Eu me pergunto se você está confuso sobre a natureza da suposição de normalidade; pode ajudá-lo a ler este tópico: E se os resíduos forem normalmente distribuídos, mas y não estiver .