Que pergunta a ANOVA responde?


9

Eu quero aprender ANOVA. Antes de começar a aprender como o algoritmo funciona (que cálculos precisam ser feitos) e por que ele funciona, primeiro gostaria de saber que problema realmente solucionamos com o ANOVA ou qual resposta tentamos responder. Em outras palavras: O que é entrada e o que é saída do algoritmo?

Eu entendo o que usamos como entrada. Temos um conjunto de números. Cada número vem com valores de uma ou mais variáveis ​​categóricas (também conhecidas como "fatores"). Por exemplo:

+------------+------------+-------+
|   factor 1 |   factor 2 | value |
+------------+------------+-------+
|     "A"    |     "a"    |  1.0  |
|     "A"    |     "a"    |  2.4  |
|     "A"    |     "b"    |  0.3  |
|     "A"    |     "b"    |  7.4  |
|     "B"    |     "a"    |  1.2  |
|     "B"    |     "a"    |  8.4  |
|     "B"    |     "b"    |  0.4  |
|     "B"    |     "b"    |  7.2  |
+------------+------------+-------+

É correto dizer que a ANOVA calcula o valor p da hipótese nula que afirma que não há efeito dos fatores na média dos valores? Em outras palavras, fornecemos os dados acima para o algoritmo e, como resultado, obtemos o valor-p da hipótese nula?

Se for esse o caso, que medida usamos realmente para calcular o valor-p. Por exemplo, podemos dizer que, dada a hipótese nula M, pode ser tão alta quanto a observada (ou até maior) apenas por acaso em 1% dos casos. O que é M?

Também não investigamos fatores na ANOVA separadamente? A ANOVA pode dizer que o fator_1 tem um efeito, mas o fator_2 não? A ANOVA pode dizer que, para um dado fator, os valores correspondentes ao valor "A", "B" e "C" são estatisticamente indistinguíveis (têm a mesma média, por exemplo), mas o valor "D" tem efeito?

Respostas:


6

ANOVA significa "Análise de Variância". Sem surpresa, ele analisa a variação.

Sejamos um pouco mais explícitos. Suas observações exibirão alguma variação. Se você agrupar suas observações pelo fator 1, a variação nos grupos definidos pelo fator 1 será menor que a variação geral. O fator 1 "explica a variação".

No entanto, isso não é suficiente para concluir que o fator 1 realmente tem um relacionamento com suas observações ... porque agrupar por qualquer coisa que "explique" a variação. O bom é que sabemos quanta variação será explicada sob a hipótese nula de que seu fator, de fato, não tem nada a ver com suas observações. Essa quantidade de variação explicada sob o nulo é descrita por uma distribuiçãoF

Assim, a estratégia na ANOVA é estimar a variação geral e a variação dentro dos grupos (usando somas de quadrados) e tomar proporções dessas variações estimadas. Essa proporção é a estatísticaEm seguida, comparamos essa estatística com o valor crítico da distribuição em um teste unilateral, produzindo seu valor . O número de níveis de fator entra em um parâmetro da distribuição (mais níveis de fator explicam mais variação sob a hipótese nula), e o número de observações e o número de níveis entra no outro. Esta pergunta anterior pode ser útil.FFFpF

(Por que um teste unilateral? Porque, como acima, qualquer agrupamento explica alguma variação, portanto, faz sentido verificar se o seu fator explica uma quantidade significativamente grande de variação.)

A seção "Exemplo motivador" da entrada da Wikipedia fornece algumas ilustrações muito agradáveis ​​de fatores que explicam muito pouco, alguns e grande parte da variação geral.

ANOVA bidirecional e interações, como no seu exemplo, bem como ANCOVA, são apenas generalizações sobre esse tema. Em cada caso, investigamos se a adição de alguma variável explicativa explica uma quantidade significativamente grande de variação.

Uma vez que tenhamos um teste geral significativo , podemos examinar se as observações de determinados níveis de fatores são significativamente diferentes das demais em testes post-hoc . Por exemplo, D pode ser diferente de A, B e C, mas esses podem não ser significativamente diferentes um do outro. Você normalmente usará testes para isso. Esta pergunta anterior pode ser útil, assim como esta .Ft


Portanto, usamos todo o número para calcular a variação geral , calculamos as variações para cada grupo e finalmente combinamos todas essas variações (provavelmente também com os tamanhos dos grupos) para obter a "medida": . Em seguida, calculamos a probabilidade de M ser tão grande quanto possível ou até maior, pressupondo que a hipótese nula esteja correta. VviM=M(V,v1,v2,...,vk,n1,n2,...,nk)
Roman

Exatamente. é a sua estatísticaAqui está a fórmula real. MF
Stephan Kolassa

Para ser sincero, ainda estou um pouco confuso. Tanto quanto eu entendi, a ANOVA retorna o valor p da hipótese nula. Por outro lado, no "Exemplo motivador" da Wikipedia, pode-se concluir que a ANOVA nos fornece o melhor fator (ou uma combinação de fatores) que "explica" os dados da melhor maneira. Assim, no exemplo, a ANOVA diz que a raça é o melhor fator para explicar o peso dos cães.
Roman

11
"Melhor" está carregado. Isso entra no território da seleção de modelo por etapas com base em valores de p, e isso é problemático. Não leia muito sobre o exemplo motivador. A melhor coisa é a descrição da variação explicada (zero, um pouco, muito). Melhor descer e ler sobre como a estatística é calculada com base em somas de quadrados e lembre-se de que essas somas de quadrados são apenas estimadores de variações. F
Stephan Kolassa
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.