Estou tentando escolher um desses dois testes para analisar dados emparelhados. Alguém conhece alguma regra prática sobre qual escolher em geral?
Estou tentando escolher um desses dois testes para analisar dados emparelhados. Alguém conhece alguma regra prática sobre qual escolher em geral?
Respostas:
Estou tentando escolher um desses dois testes para analisar dados emparelhados. Alguém conhece alguma regra prática sobre qual escolher em geral?
O teste de classificação assinado carrega uma suposição sobre a simetria das diferenças sob o nulo que o teste de sinal não precisa. (Essa suposição é necessária para que as permutações dos sinais anexados às fileiras de diferenças não assinadas sejam igualmente prováveis.)
Por outro lado, se houver quase simetria na população e a cauda não for muito pesada, o posto assinado deverá ter mais poder.
[Isso não deve ser tomado como conselho para escolher entre eles com base na amostra ; em geral, isso leva a propriedades de teste diferentes das nominais (os testes podem ser tendenciosos, os níveis de significância reais não são mais o que parecem ser, os valores de p calculados não representam valores de p verdadeiros e assim por diante). Em vez disso, sempre que possível, as características devem ser avaliadas com base no conhecimento externo à amostra à qual o teste é aplicado - seja pelo conhecimento da área de assunto, familiaridade com outros conjuntos de dados como este, separação de amostras, ...]
No meu caso, o teste de soma de classificação tem o maior valor-p, teste de sinal é o meio, classificação de sinal é o menor. Portanto, tem mais poder.
Não é assim que você decide que um teste tem mais poder - um valor p mais baixo em relação a uma amostra pode ser simplesmente devido aos caprichos dessa amostra, enquanto poder é sobre o comportamento em todas as amostras aleatórias retiradas da mesma população.
Ou seja, imagine que você esteja lidando com alguma situação específica em que a população de diferenças de pares esteja centrada um pouco longe de 0 (ou seja, que seja falso de uma maneira específica). Então, sob amostragem repetida nas mesmas condições (incluindo tamanho da amostra), a potência será a taxa de rejeição para essa população em particular.
De maneira semelhante, poderíamos calcular a taxa de rejeição para uma sequência de populações com localização diferente * das diferenças de pares e obter uma curva de potência inteira. Então "potência superior" corresponderia a toda a curva de potência (ou quase toda, observando que ambas deveriam estar no mesmo nível de significância) para um teste colocado acima do outro.
* você pode considerar uma mediana para a presente discussão - enquanto o estimador para o teste de classificação assinado é a mediana das médias pares de diferenças entre pares, sob a suposição de simetria, o estimador de localização também deve ser uma estimativa adequada do par mediano diferença.
Aqui está uma pergunta relacionada Como escolher entre o teste t ou não paramétrico, por exemplo, Wilcoxon em amostras pequenas . Uma das respostas inclui uma (breve) discussão sobre a presente questão.