Existem vários sentidos dos quais "depende".
(Uma preocupação em potencial é que parece que os dados originais talvez sejam discretos; isso deve ser esclarecido.)
dependendo do tamanho da amostra, a não normalidade pode não ser tão grande quanto a do teste t. Para amostras grandes, pelo menos geralmente há boa robustez de nível - as taxas de erro do tipo I não devem ser muito afetadas se não estiver muito longe do normal. Poder pode ser mais um problema com caudas pesadas.
Se você estiver procurando por algum tipo de diferença na distribuição, um teste de ajuste de qualidade de duas amostras, como o teste de Kolmogorov-Smirnov de duas amostras, pode ser adequado (embora outros testes possam ser realizados).
Se você estiver procurando por diferenças de tipo de local em uma família de locais ou diferenças de escala em uma família de escalas, ou mesmo apenas uma relação do tipo P (X> Y)> P (Y> X), uma Wilcoxon-Mann-Whitney teste de duas amostras pode ser adequado.
Você pode considerar testes de reamostragem, como testes de permutação ou autoinicialização, se conseguir encontrar uma estatística adequada para o (s) tipo (s) de diferenças às quais deseja ter sensibilidade.
Além disso, se eu tiver 13 distribuições, preciso fazer 13 ^ 2 testes?
Bem, não .
Em primeiro lugar, você não precisa testar vs B e B vsAB BA
Em segundo lugar, você não precisa testar vsAA
Essas duas coisas reduziram as comparações de pares de 169 para 78.
Em terceiro lugar, seria muito mais usual (mas não obrigatório) testar coletivamente quaisquer diferenças e, talvez, examinar diferenças pareadas em testes post-hoc pares a pares se o primeiro nulo fosse rejeitado.
Por exemplo, no lugar de um Wilcoxon-Mann-Whitney como no item 3. acima, pode-se fazer um teste de Kruskal-Wallis, que é sensível a quaisquer diferenças na localização entre os grupos.
Há também versões de amostra k do teste de Kolmogorov-Smirnov , e testes semelhantes de alguns dos outros testes de ajuste de qualidade de duas amostras podem existir ou ser construídos.
Também existem versões de amostra k de testes de reamostragem e de teste t (ou seja, ANOVA, o que pode ser bom se o tamanho da amostra for razoavelmente grande).
Seria muito bom obter mais informações sobre o que estamos lidando e em que tipos de diferenças você está mais interessado; ou, na sua falta, para visualizar gráficos QQ de algumas das amostras.