(Puxa Conover [1] da estante ...)
Essa ideia é bastante antiga; remonta pelo menos a van der Waerden (1952/1953) [2] [3], que sugeriu um teste que corresponde ao Kruskal Wallis, mas com classificações substituídas por notas normais. (A idéia de usar valores normais aleatórios ordenados em vez de uma aproximação de suas expectativas ou medianas - talvez seja até um pouco mais antiga.)
De acordo com Conover, Fisher e Yates (1957) [4] sugerem substituir as observações pelas pontuações normais esperadas (ou seja, classificações transformadas) em uma variedade de testes em que a normalidade seria assumida.
A eficiência relativa assintótica no normal será 1, o que o torna bastante atraente ... no entanto, a vantagem de dizer que o Wilcoxon-Mann-Whitney (ganho de poder) - mesmo no normal - é muito pequeno, e se a distribuição for mais pesada do que o normal (por exemplo, logística), pode ser desvantajoso fazer isso. (Algumas simulações sugerem que esse é realmente o caso: a menos que a distribuição já esteja quase normal - nesse caso, não há nenhum benefício em fazer a transformação - essa transformação pode realmente perder energia.)
Chernoff e Lehmann [5] calculam o poder assintótico para uma variedade de distribuições; onde há pelo menos uma cauda muito curta (como o uniforme), o teste de pontuação normal pode ter um ARE muito melhor para uma alternativa de turno contra o Wilcoxon-Mann-Whitney - melhor do que o próprio teste t. Seus resultados concordam com minhas simulações para casos de cauda mais pesada.
Observe que no caso de duas amostras, à medida que a separação nos meios se torna grande, enquanto a amostra combinada parece bastante normal, as duas amostras não são normais:
Como resultado, nem todas as propriedades do teste normal serão transferidas para o teste de pontuação normal, e o comportamento em separações maiores (com amostras pequenas) pode ser um pouco contra-intuitivo.
Os testes obtidos por essa idéia são chamados coletivamente de testes de pontuação normal , cujo termo de pesquisa (via Google, por exemplo) apresenta várias referências.
Por exemplo, aqui , Richard Darlington discute fazer isso para o teste de fileiras assinadas de Wilcoxon; ele ressalta que há uma vantagem sobre o teste de classificação simples, porque reduz o número de valores vinculados da estatística de teste.
Antes de terminar de escrever as páginas, deixarei você pesquisar mais.
O Conover lista várias outras referências e tem bastante discussão, então eu definitivamente recomendo a leitura.
O argumento de Gelman, no entanto, parece ser sobre conveniência - não sendo necessário desenvolver um novo teste cada vez que a situação muda; embora se a conveniência é a questão principal, já existe a capacidade de usar testes de permutação em qualquer estatística que gostamos. [Com a abordagem das pontuações normais, a dificuldade é que ainda precisamos de uma maneira adequada de classificar - você não pode apenas classificar coisas que não são comparáveis sob o nulo e esperar o tipo certo de comportamento. Há um problema semelhante com o teste de permutação, pois você também precisa de permutabilidade sob o valor nulo.]
Você menciona uma função R, mas pode classificar e converter facilmente em notas normais em R apenas usando funções que já vêm com R.
por exemplo, usando os sleep
dados em R., você faria um teste t desta maneira:
t.test(extra ~ group, data = sleep) # Welch
t.test(extra ~ group, data = sleep, var.equal=TRUE) # equal-variance
t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep) # normal scores
[1] Conover, WJ (1980),
Practical Nonparameteric Statistics , 2e.
Wiley. 316-327.
(A partir do link da Wikipedia acima, parece que em 3e (1999) a discussão começa na pg. 39)
[2] van der Waerden, BL (1952),
"Encomende testes para o problema de duas amostras e seu poder",
Anais da Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 55 ( Indagationes Mathematicae 14 ), 453-458.
[3] van der Waerden, BL (1953),
"Ensaios de pedidos para o problema de duas amostras. II, III",
Anais da Koninklijke Nederlandse Akademie van Wetenschappen , Série A 56 ( Indagationes Mathematicae , 15 ), 303-310 & 311-316.
(também há correções no artigo de 1952 na p. 80 desse volume)
[4] Fisher RA e Yates F. (1957)
Tabelas Estatísticas para Pesquisa Biológica, Agrícola e Médica , 5e, Oliver & Boyd, Edimburgo.
[5] Hodges, JL; Lehmann, EL (1961),
"Comparação dos Escores Normais e Testes de Wilcoxon",
Anais do Quarto Simpósio de Berkeley sobre Estatística Matemática e Probabilidade, Volume 1: Contribuições para a Teoria da Estatística , 307-317,
University of California Press, Berkeley, Califórnia.
Http://projecteuclid.org/euclid.bsmsp/1200512171 .