(Para tornar nossas noções um pouco mais precisas, vamos chamar de 'estatística de teste' a distribuição da coisa que procuramos para realmente computar o valor p. Isso significa que, para um teste t bicaudal, nossa estatística de teste seria vez de )| T|T
O que uma estatística de teste faz é induzir uma ordem no espaço da amostra (ou mais estritamente, uma ordem parcial), para que você possa identificar os casos extremos (os mais consistentes com a alternativa).
No caso do teste exato de Fisher, já existe uma ordenação em um sentido - quais são as probabilidades das próprias tabelas 2x2. Por acaso, eles correspondem à ordem em no sentido de que os valores maiores ou menores de são 'extremos' e também são os que têm menor probabilidade. Portanto, em vez de examinar os valores de da maneira que você sugere, pode-se simplesmente trabalhar com os extremos grandes e pequenos, a cada passo apenas adicionando qualquer valor (o maior ou o menorX1,1X1,1X1,1X1,1-valor ainda não existente) tem a menor probabilidade associada a ele, continuando até chegar à sua tabela observada; na sua inclusão, a probabilidade total de todas essas tabelas extremas é o valor de p.
Aqui está um exemplo:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
A primeira coluna é , a segunda coluna são as probabilidades e a terceira coluna é a ordem induzida.X1,1
Portanto, no caso específico do teste exato de Fisher, a probabilidade de cada tabela (equivalentemente, de cada valor ) pode ser considerada a estatística real do testeX1,1 .
Se você comparar sua estatística de teste sugerida, induz a mesma ordem neste caso (e acredito que o faça em geral, mas não marquei), em que valores maiores dessa estatística são os menores da probabilidade; portanto, poderia igualmente ser considerado 'a estatística' - mas também muitas outras quantidades - de fato, todas as que preservam essa ordem dos s em todos os casos são estatísticas de teste equivalentes, porque sempre produzem valores-p idênticos.|X1,1−μ|X1,1
Observe também que, com a noção mais precisa de 'estatística de teste' introduzida no início, nenhuma das estatísticas de teste possíveis para esse problema realmente tem uma distribuição hipergeométrica; sim, mas na verdade não é uma estatística de teste adequada para o teste bicaudal (se fizermos um teste unilateral em que apenas mais associação na diagonal principal e não na segunda diagonal seja considerada consistente com a alternativa, seria uma estatística de teste). Este é apenas o mesmo problema de uma ou duas caudas que eu comecei.X1,1
[Edit: alguns programas apresentam uma estatística de teste para o teste de Fisher; Eu presumo que este seria um cálculo do tipo -2logL que seria assintoticamente comparável a um qui-quadrado. Alguns também podem apresentar o odds ratio ou seu log, mas isso não é bem equivalente.]