O teste de hipóteses é semelhante a um problema de classificação. Digamos, temos 2 rótulos possíveis para uma observação (assunto) - Culpado vs. Não culpado. Seja Não-Culpado a hipótese nula. Se visualizarmos o problema do ponto de vista da Classificação, treinaremos um Classificador que preverá a probabilidade do sujeito pertencer a cada uma das 2 Classes, dados os Dados. Em seguida, escolheríamos a classe com a maior probabilidade. Nesse caso, a probabilidade de 0,5 seria o limiar natural. Podemos variar o limite, caso atribuímos custos diferentes a erros de falso positivo e falso negativo. Mas raramente iríamos tão extremos quanto estabelecer o limite em 0,05, ou seja, atribuir o assunto à Classe "Culpado" somente se a probabilidade for 0,95 ou superior. Mas se eu entendo bem, é isso que estamos fazendo como prática padrão quando vemos o mesmo problema que o teste de hipóteses. Neste último caso, não atribuiremos o rótulo "Não culpado" - equivalente a atribuir o rótulo "Culpado" - apenas se a probabilidade de ser "Não culpado" for inferior a 5%. E talvez isso faça sentido se realmente quisermos evitar condenar pessoas inocentes. Mas por que essa regra deve prevalecer em todos os domínios e em todos os casos?
Decidir qual hipótese adotar é equivalente a definir um estimador da verdade dado os dados. Na Estimativa de máxima verossimilhança, aceitamos a hipótese que é mais provável, dados os dados - não necessariamente, embora seja extremamente provável. Veja o gráfico abaixo:
Usando uma abordagem de máxima verossimilhança, favoreceríamos a hipótese alternativa neste exemplo se o valor do preditor fosse superior a 3, por exemplo, 4, embora a probabilidade desse valor ter sido derivada da hipótese nula teria sido maior que 0,05.
E embora o exemplo com o qual eu comecei o post seja talvez emocionalmente carregado, poderíamos pensar em outros casos, por exemplo, uma melhoria técnica. Por que devemos dar essa vantagem ao Status Quo quando os Dados nos dizem que a probabilidade de que a nova solução seja uma melhoria é maior que a probabilidade de que não é?