Quão significativo é um valor comparado a uma lista de valores? Na maioria dos casos, o teste estatístico envolve a comparação de um conjunto de amostras com uma população. No meu caso, a amostra é composta por um valor e a comparamos com a população.
Sou um diletante no teste de hipóteses estatísticas confrontado talvez com o problema mais básico. Não é apenas um teste, mas centenas deles. Eu tenho um espaço de parâmetro e devo fazer um teste de significância para cada ponto. O valor e a lista de plano de fundo (população) são gerados para cada combinação de parâmetros. Então, eu estou ordenando isso pelo valor-p e encontro combinações interessantes de parâmetros. De fato, o achado de combinações de parâmetros em que esse p-val é alto (não significativo) também é importante.
Então, vamos fazer um único teste: eu tenho um valor calculado gerado a partir de um conjunto selecionado e um conjunto de valores em segundo plano calculado escolhendo um conjunto de treinamento aleatório. O valor calculado é 0,35 e o conjunto de plano de fundo é (provavelmente?) Normalmente distribuído com uma média de 0,25 e um valor padrão muito estreito (e-7). Na verdade, eu não tenho conhecimento da distribuição, porque as amostras são calculadas a partir de outra coisa, não são amostras de números aleatórios de alguma distribuição, portanto, fundo é a palavra correta para ela.
A hipótese nula seria que "a média do teste da amostra é igual ao meu valor calculado, de 0,35". Quando devo considerar que isso é um teste Z ou um teste T? Eu quero que o valor seja significativamente maior que a média da população, portanto, é um teste de cauda única.
Estou um pouco confuso sobre o que considerar como amostra: ou tenho uma amostra de uma (a observação) e a lista de segundo plano como a população OU minha amostra é a lista de segundo plano e estou comparando isso com o todo (sem amostra) população que, segundo a hipótese nula, deveria ter a mesma média. Uma vez decidido, o teste vai para direções diferentes, eu acho.
Se for um teste T, como computo seu valor-p? Gostaria de calculá-lo eu mesmo, em vez de usar uma função R / Python / Excel (eu já sei como fazer isso), portanto, devo estabelecer primeiro a fórmula correta.
Para começar, suspeito que um teste T seja um pouco genérico demais, pois, no meu caso, o teste T estaria vinculado ao tamanho da amostra e teria a forma: que Z = ˉ X
- Como computo um valor-p? (ou seja, não use uma função R / Python / Excel ou pesquisa de tabela de valor p, mas na verdade calcule-a com base em uma fórmula, porque quero saber o que estou fazendo)
- Como decido um limite de significância com base no tamanho da minha amostra? (uma fórmula seria legal)