Se a declaração original não limitar as condições sob as quais se aplica de maneira substancial, Field está errado nisso.
Respondendo à seção citada:
Com efeito, isso significa que faz o mesmo que o teste de Mann-Whitney!
Não, realmente não. Eles realmente testam diferentes tipos de coisas. Como exemplo, se duas distribuições quase simétricas diferem na propagação, mas não diferem na localização, o Kolmogorov-Smirnov pode identificar esse tipo de diferença (em amostras grandes o suficiente em relação ao efeito), mas a Wilcoxon-Mann-Whitney não posso.
Isso ocorre porque eles são projetados para diferentes propósitos.
"No entanto, esse teste tende a ter melhor poder do que o teste de Mann-Whitney quando o tamanho da amostra é inferior a cerca de 25 por grupo, e vale a pena selecionar se for esse o caso".
n<25
[Pode haver alguma situação em que a afirmação é verdadeira; se Field não explicar em que contexto sua reivindicação se aplica, provavelmente não sou capaz de adivinhar.]
Aqui está uma curva de potência para n = 20 por grupo. O nível de significância é um pouco acima de 3% para cada teste (na verdade, o nível de significância alcançável para o KS é um pouco mais alto e eu não tentei usar um teste aleatório para ajustar essa diferença, de modo que foi dada uma pequena vantagem nessa comparação ):
Como vemos, neste caso (o primeiro que tentei) o Wilcoxon-Mann-Whitney é claramente mais poderoso.
Em n = 5, o Kolmogorov-Smirnov permanece menos poderoso para esta situação. [Então, do que diabos ele está falando? Ele está comparando poder para alguma situação não mencionada na citação? Não sei, mas, seguindo o que é citado aqui, não devemos aceitar essa afirmação pelo valor de face. Foi errado na primeira coisa que verifiquei e - com base em uma familiaridade mais ampla com os dois testes, eu apostaria prontamente que isso é errado para várias outras situações.]
Nas amostras de 4 e 11 para alternativas de turno (e populações normais), novamente, o Wilcoxon-Mann-Whitney se sai melhor.
Com a variável que você está vendo, uma alternativa adequada provavelmente é algo mais como uma mudança de escala; mas se algum poder (como uma raiz quadrada ou raiz de cubo disser ou melhor ainda um log) de seus dados não for muito normal, esses resultados que eu mencionei devem ser relevantes. Se você tem dados discretos ou inflados com zero que podem fazer alguma diferença, mas minha aposta seria que o Kolmogorov-Smirnov não ultrapassa o Wilcoxon-Mann-Whitney. [Não vou prosseguir com isso no momento, porque não está claro se é relevante para a sua situação.]
Além disso, os níveis de significância alcançáveis com o Kolmogorov-Smirnov são muito escassos em amostras pequenas. Geralmente, você não pode obter testes próximos dos níveis de significância usuais que provavelmente deseja. (O WMW se sai muito melhor que o KS em relação aos tamanhos de teste disponíveis. Existe uma maneira interessante de melhorar drasticamente essa situação de falta de níveis sem perder a natureza não paramétrica ou baseada em classificação de testes como esses - isso também não acontece. envolvem testes aleatórios - mas parece ser muito raramente usado por algum motivo.)
α=0.05
Se você estiver em uma situação em que o Wilcoxon-Mann-Whitney testa o que você deseja testar, eu definitivamente não recomendaria o uso do Kolmogorov-Smirnov. Eu usaria cada teste para o que eles foram projetados para testar, que é onde eles tendem a se sair bem.
A melhor maneira de descobrir o que é melhor é tentar algumas simulações em situações que seriam realistas para o tipo de dados que você terá. Então você pode ver quando faz o quê.
Além disso, ao relatar as entradas juntamente com os valores de p, devo usar média e desvio padrão ou mediana e IQR, pois os dados não são paramétricos?
Dados são apenas dados. Eles não são paramétricos nem não paramétricos - isso é uma propriedade dos modelos e procedimentos inferenciais que usamos, que dependem deles (estimativa, teste, intervalos). Paramétrico significa "definido até um número fixo e finito de parâmetros", que não é um atributo de dados, mas de modelos. Se você não pode simplesmente fornecer os dois conjuntos de valores (qual seria a minha preferência) e deve escolher um ou outro, o que é mais relevante cientificamente ou em relação à sua pergunta de interesse?
[Observe que Wilcoxon-Mann-Whitney não compara meios ou medianas (a menos que você adicione algumas suposições que aposto que não chegam nem perto de aplicar neste caso). Nem o Kolmogorov-Smirnov.]