Como os autores dos testes estatísticos de hipóteses apresentaram suas estatísticas?
Existem várias maneiras de identificar estatísticas de teste, dependendo das circunstâncias. É importante tentar identificar as alternativas que você considera importantes e tentar obter algum poder contra elas, sob algum conjunto plausível de suposições.
Se você tem uma hipótese relacionada às médias populacionais (na verdade, vamos simplificar e considerar um teste de uma amostra), por exemplo, uma estatística baseada na média da amostra pareceria uma escolha óbvia para uma estatística, pois tenderá a comportar-se de maneira diferente sob o nulo e a alternativa. No entanto (por exemplo), se você estiver procurando alternativas de turno para uma família Laplace / dupla exponencial ( ), algo baseado na mediana da amostra seria uma escolha melhor para um teste de uma mudança na média do que algo baseado na média da amostra.DExp(μ,τ)
Se você possui um modelo paramétrico específico (com base em uma família de distribuição específica), é comum considerar pelo menos um teste de razão de verossimilhança , pois eles possuem várias propriedades atraentes para amostras grandes.
Em muitas situações em que você está tentando projetar um teste do zero, uma estatística de teste será baseada em uma quantidade essencial . A estatística do teste em um teste t de uma amostra (assim como em muitos outros testes que você já viu antes) é uma quantidade essencial.
Dado um problema específico, é sempre óbvio qual deve ser a estatística ideal (se é que é definível por razões objetivas)?
De modo nenhum. Considere um teste de normalidade geral contra uma alternativa ominibus, por exemplo. Existem muitas maneiras de medir o desvio da normalidade (dezenas desses testes foram propostos) e, em tamanhos de amostra típicos, nenhum deles é mais poderoso contra todas as alternativas.
Ao tentar projetar um teste para uma situação como essa, é necessária uma certa quantidade de criatividade para se chegar a uma escolha que tenha um bom poder contra os tipos de alternativas que você está mais interessado em escolher.
Parece que esses dois requisitos listados na etapa 2 acima são muito amplos e muitas estatísticas diferentes podem ser criadas para testar as mesmas hipóteses.
De fato. Se você fizer alguma suposição paramétrica (suponha que os dados sejam extraídos de alguma família de distribuição e, em seguida, faça sua hipótese se relacionar com um ou mais parâmetros dela), pode haver um teste da melhor maneira possível para todas essas situações (especificamente, uma uniformidade mais poderosa teste), mas mesmo assim, se sua suposição paramétrica for mais parecida com uma suposição aproximada, o desejo de alguma robustez nessa suposição poderá mudar bastante as coisas.
Por exemplo (novamente, fazer um teste de uma amostra de mudança de local para ser simples), se eu estiver amostrando em uma população normal, um teste t será o melhor. Mas digamos que eu acho que pode não ser exatamente normal e, além disso, pode haver uma pequena quantidade de contaminação por algum outro processo com uma cauda moderadamente pesada, depois algo mais robusto (talvez até uma alternativa baseada em classificação como a assinada teste de classificação) tendem a ter um desempenho melhor em uma variedade de situações desse tipo.