Eu tenho um conjunto de resultados de um teste A / B (um grupo de controle, um grupo de recursos) que não se encaixam em uma distribuição normal. De fato, a distribuição se assemelha mais à Distribuição Landau.
Acredito que o teste t independente exige que as amostras sejam distribuídas pelo menos aproximadamente aproximadamente normalmente, o que me desencoraja a usar o teste t como um método válido de teste de significância.
Mas minha pergunta é: em que momento se pode dizer que o teste t não é um bom método de teste de significância?
Ou, em outras palavras, como se pode qualificar a confiabilidade dos valores-p de um teste t, considerando apenas o conjunto de dados?