Eu tenho uma simulação em que um animal é colocado em um ambiente hostil e cronometrado para ver quanto tempo ele pode sobreviver usando alguma abordagem para a sobrevivência. Existem três abordagens que podem ser usadas para sobreviver. Eu fiz 300 simulações do animal usando cada abordagem de sobrevivência. Todas as simulações ocorrem no mesmo ambiente, mas há alguma aleatoriedade, por isso é diferente a cada vez. Eu cronometro quantos segundos o animal sobrevive em cada simulação. Viver mais é melhor. Meus dados são assim:
Approach 1, Approach 2, Approach 2
45,79,38
48,32,24
85,108,44
... 300 rows of these
Não tenho certeza de tudo o que faço após esse ponto, então deixe-me saber se estou fazendo algo estúpido e errado. Estou tentando descobrir se há uma diferença estatística no tempo de vida usando uma abordagem específica.
Fiz um teste Shapiro em cada uma das amostras e elas retornaram com pequenos valores de p, então acredito que os dados não são normalizados.
Os dados nas linhas não têm relação entre si. A semente aleatória usada para cada simulação foi diferente. Como resultado, acredito que os dados não estão emparelhados.
Como os dados não são normalizados, não estão emparelhados e havia mais de duas amostras, executei um teste de Kruskal Wallis que retornou com um valor de p de 0,048. Depois, mudei para um post hoc, selecionando Mann Whitney. Realmente não tenho certeza se Mann Whitney deve ser usado aqui.
Comparei cada abordagem de sobrevivência com a outra, realizando o teste de Mann Whitney, ou seja, {(abordagem 1, abordagem 2), (abordagem 1, abordagem 3), (abordagem 2, abordagem 3)}. Não houve achado de significância estatística entre o par (abordagem 2, abordagem 3) usando um teste bicaudal, mas houve diferença de significância encontrada usando um teste bicaudal.
Problemas:
- Não sei se usar Mann Whitney assim faz sentido.
- Não sei se devo usar um Mann Whitney de uma ou duas caudas.