Qual é a estatística do teste exato de Fisher?


9

Para uma tabela 2 por 2 contingência, alguns disseram que o teste exato de Fisher usa a contagem no (1,1) célula na tabela como a estatística de teste, e sob hipótese nula, vontade tem uma distribuição hipergeométrica. X 1 , 1X1,1X1,1

Alguns disseram que sua estatística de teste é onde é a média da distribuição hipergeométrica (mencionada acima) sob nulo. Ele também disse que os valores de p são determinados com base na tabela de distribuição hipergométrica. Fiquei me perguntando se há algum motivo para subtrair média e, em seguida, para ter valor absoluto? não tem uma distribuição hipergeométrica sob nulo, não é?u | X 1 , 1 - μ |

|X1,1μ|
μ|X1,1μ|

Respostas:


10

(Para tornar nossas noções um pouco mais precisas, vamos chamar de 'estatística de teste' a distribuição da coisa que procuramos para realmente computar o valor p. Isso significa que, para um teste t bicaudal, nossa estatística de teste seria vez de )|T|T

O que uma estatística de teste faz é induzir uma ordem no espaço da amostra (ou mais estritamente, uma ordem parcial), para que você possa identificar os casos extremos (os mais consistentes com a alternativa).

No caso do teste exato de Fisher, existe uma ordenação em um sentido - quais são as probabilidades das próprias tabelas 2x2. Por acaso, eles correspondem à ordem em no sentido de que os valores maiores ou menores de são 'extremos' e também são os que têm menor probabilidade. Portanto, em vez de examinar os valores de da maneira que você sugere, pode-se simplesmente trabalhar com os extremos grandes e pequenos, a cada passo apenas adicionando qualquer valor (o maior ou o menorX1,1X1,1X1,1X1,1-valor ainda não existente) tem a menor probabilidade associada a ele, continuando até chegar à sua tabela observada; na sua inclusão, a probabilidade total de todas essas tabelas extremas é o valor de p.

Aqui está um exemplo:

função de probabilidade hipergeométrica

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

A primeira coluna é , a segunda coluna são as probabilidades e a terceira coluna é a ordem induzida.X1,1

Portanto, no caso específico do teste exato de Fisher, a probabilidade de cada tabela (equivalentemente, de cada valor ) pode ser considerada a estatística real do testeX1,1 .

Se você comparar sua estatística de teste sugerida, induz a mesma ordem neste caso (e acredito que o faça em geral, mas não marquei), em que valores maiores dessa estatística são os menores da probabilidade; portanto, poderia igualmente ser considerado 'a estatística' - mas também muitas outras quantidades - de fato, todas as que preservam essa ordem dos s em todos os casos são estatísticas de teste equivalentes, porque sempre produzem valores-p idênticos.|X1,1μ|X1,1

Observe também que, com a noção mais precisa de 'estatística de teste' introduzida no início, nenhuma das estatísticas de teste possíveis para esse problema realmente tem uma distribuição hipergeométrica; sim, mas na verdade não é uma estatística de teste adequada para o teste bicaudal (se fizermos um teste unilateral em que apenas mais associação na diagonal principal e não na segunda diagonal seja considerada consistente com a alternativa, seria uma estatística de teste). Este é apenas o mesmo problema de uma ou duas caudas que eu comecei.X1,1

[Edit: alguns programas apresentam uma estatística de teste para o teste de Fisher; Eu presumo que este seria um cálculo do tipo -2logL que seria assintoticamente comparável a um qui-quadrado. Alguns também podem apresentar o odds ratio ou seu log, mas isso não é bem equivalente.]


Obrigado, Glen_b! a distribuição de sob nulo é a distribuição hipergeométrica, que não é simétrica em torno de sua média . Então, eu queria saber seé uma estatística de teste razoável? X1,1μ|X1,1μ|
26413 Tim

Parece uma estatística de teste eminentemente razoável, já que é completamente interpretável e prontamente entendida. De fato, nenhuma das estatísticas possíveis terá uma distribuição simétrica. Vamos esquecer as especificidades do teste de Fisher por um momento - se essa estatística for significativa para você, você pode calcular um teste exato com base nisso (usando cálculos hipergeométricos para encontrar as probabilidades). Se você quiser mostrar que eles estão induzindo a mesma ordem em todos os casos, essa é provavelmente uma nova pergunta.
Glen_b -Reinstate Monica

6

u | X 1 , 1 - μ | X 1 , 1|X1,1μ|não pode ter uma distribuição hipergeométrica em geral porque não precisa ser um valor inteiro e, em seguida,não seria um número inteiro. Mas condicionalmente nas margens, terá uma distribuição hipergeométrica.μ|X1,1μ|X1,1

Se você fizer isso corretamente e fixar as margens em valores conhecidos, poderá considerar (ou qualquer outra célula) como sua estatística. Com a analogia de desenhar bolas de uma urna contendo bolas brancas e bolas pretas sem substituição, pode ser interpretado como o número de bolas brancas desenhadas, onde é a soma da primeira linha, é a soma da segunda linha, é a soma da primeira coluna. k W B X 1 , 1 B W kX1,1kWBX1,1BWk


4

Realmente não tem um. As estatísticas de teste são uma anomalia histórica - a única razão pela qual temos uma estatística de teste é obter um valor p. O teste exato de Fisher passa por uma estatística de teste e vai direto para um valor-p.


Obrigado, mas não existe realmente uma estatística de teste? Como você determina o valor de p então?
Tim

O resultado do teste exato de Fisher é o valor de p.
Jeremy Miles.

@JeremyMiles: você quer dizer que as estatísticas de teste são anomalias históricas em que, antes da computação de baixo custo, os usuários calculavam Z, te assim por diante e comparavam essa estatística de teste com as tabelas pré-calculadas para determinar a significância estatística e, como resultado, muitos usuários atuais de estatísticas inferenciais ainda pensam em termos de estatísticas de teste quando poderiam fornecer um valor-p com a mesma facilidade? Em outras palavras, isso é um tipo de efeito geracional?
rabidotter

11
@rabidotter - sim, acho que sim. Você vê pessoas que escrevem "F = 14,352, df = 2, 568, p <0,05". Praticamente a única razão pela qual alguém se preocupa com F é calcular P, mas eles dão F a uma precisão maciça ep para uma precisão muito pequena.
Jeremy Miles
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.