Qual é a diferença entre ter algo estatisticamente significativo (como uma diferença entre duas amostras) e declarar se um grupo de números é independente ou dependente.
Qual é a diferença entre ter algo estatisticamente significativo (como uma diferença entre duas amostras) e declarar se um grupo de números é independente ou dependente.
Respostas:
A importância em um teste t de amostras independentes significa apenas que a probabilidade (se o nulo for verdadeiro) de amostrar uma diferença média tão extrema quanto a diferença média que você realmente amostrou é menor que 0,05.
Isso não tem nenhuma relação com dependente / independente. "Dependente" significa que a distribuição de algumas observações individuais está conectada à distribuição de outras; por exemplo, A) elas são a mesma pessoa fazendo o mesmo teste uma segunda vez, B) as pessoas de cada grupo são equiparadas a alguma variável de pré-teste, C) as pessoas nos dois grupos estão relacionadas (ou seja, família). "Independente" significa que não existe tal conexão.
Por que parar em -Testes?
Você pode pensar em duas variáveis sendo não correlacionadas como dois vetores ortogonais, exatamente como os e y eixos em um dimensional sistema de coordenadas cartesianas dois.
Quando qualquer um dos dois vectores de, digamos e y está correlacionada com a outra, haverá uma determinada parte de x que pode ser projectadas no Y e vice-versa. Com isso em mente, é bastante fácil perceber que, uma vez que,
Onde é o coeficiente de correlação de Pearson e é o produto interno dos argumentos. Quando aprendi isso, fiquei totalmente impressionado com a geometria simples da idéia de correlação. E essa definitivamente não é a única maneira de medir a correlação entre duas (ou mais) variáveis.⟨ ⋅ , ⋅ ⟩
O teste de significância é um jogo de bola diferente. Muitas vezes queremos saber em quanto medida dois (ou mais) grupos diferem em alguma variável de resultado como resultado de alguma manipulação que foi realizada nesses grupos. Como Brian disse, você quer saber se os dois grupos vêm da mesma distribuição e, assim, calcula a probabilidade de amostrar a diferença média (escalada pelo erro padrão da média) que obteve do seu experimento, considerando que a hipótese nula (não há diferença significativa nos meios) é verdadeira. Na pesquisa comportamental (e geralmente em outros lugares), se essa probabilidade for menor que 0,05, você pode concluir que a diferença entre os dois (ou mais) meios provavelmente se deve à sua manipulação.
Edição : Dilip Sarwate apontou que duas variáveis não correlacionadas podem ser estatisticamente dependentes, então eu retirei a primeira parte. Obrigado por isso.