Você pode usar um intervalo de confiança (IC) para testar hipóteses. No caso típico, se o IC de um efeito não ultrapassar 0, você poderá rejeitar a hipótese nula. Mas um IC pode ser usado para obter mais informações, enquanto relatar se foi aprovado é o limite da utilidade de um teste.
O motivo pelo qual você recomenda usar o IC em vez de apenas um teste t, por exemplo, é porque você pode fazer mais do que apenas testar hipóteses. Você pode fazer uma declaração sobre a gama de efeitos que acredita ser provável (os do IC). Você não pode fazer isso apenas com um teste t. Você também pode usá-lo para fazer declarações sobre o nulo, o que você não pode fazer com um teste t. Se o teste t não rejeitar o nulo, basta dizer que não é possível rejeitar o nulo, o que não significa muito. Mas se você tiver um intervalo de confiança estreito em torno do nulo, poderá sugerir que o nulo, ou um valor próximo a ele, provavelmente seja o valor verdadeiro e sugerir que o efeito do tratamento, ou variável independente, é muito pequeno para ser significativo ( ou que seu experimento não
Adicionado mais tarde:
eu realmente deveria ter dito isso, embora você possa usar um IC como um teste, não é um. É uma estimativa de um intervalo em que você acha que os valores dos parâmetros estão. Você pode fazer testes como inferências, mas é muito melhor nunca falar sobre isso dessa maneira.
Qual é melhor?
A) O efeito é 0,6, t (29) = 2,8, p <0,05. Este efeito estatisticamente significativo é ... (alguns ensues discussão sobre este significância estatística, sem qualquer menção ou mesmo forte capacidade de discutir a implicação prática da magnitude da descoberta ... sob um quadro Neyman-Pearson a magnitude do t e Os valores de p são praticamente sem sentido e tudo o que você pode discutir é se o efeito está presente ou se não está presente. Você nunca pode realmente falar sobre realmente não haver um efeito baseado no teste.)
ou
B) Usando um intervalo de confiança de 95%, estimo o efeito entre 0,2 e 1,0. (segue-se uma discussão sobre o efeito real do interesse, se os valores plausíveis são aqueles que têm algum significado específico e qualquer uso da palavra significativo exatamente para o que deveria significar. Além disso, a largura do IC pode ir diretamente para uma discussão sobre se essa é uma descoberta forte ou se você só pode chegar a uma conclusão mais experimental)
Se você fez uma aula de estatística básica, inicialmente pode se dirigir para A. E pode haver alguns casos em que é uma maneira melhor de relatar um resultado. Mas, para a maioria dos trabalhos, B é de longe superior. Uma estimativa de faixa não é um teste.