Você pode citar o Teorema Sem Almoço Gratuito, se quiser, mas também pode citar o Modus Ponens (também conhecido como Lei do Desapego , a base do raciocínio dedutivo), que é a raiz do Teorema Sem Almoço Gratuito .
O Teorema Sem Almoço Gratuito engloba uma idéia mais específica: o fato de que não há algoritmo capaz de atender a todos os propósitos. Em outras palavras, o Teorema Sem Almoço Gratuito está basicamente dizendo que não existe uma bala mágica algorítmica . Isso se baseia no Modus Ponens, porque, para que um algoritmo ou um teste estatístico dê o resultado correto, você precisa satisfazer as premissas.
Assim como em todos os teoremas matemáticos, se você violar as premissas, o teste estatístico fica sem sentido e você não pode derivar nenhuma verdade disso. Portanto, se você deseja explicar seus dados usando seu teste, deve presumir que as premissas necessárias são atendidas, se não forem (e você sabe disso), seu teste estará totalmente errado.
Isso ocorre porque o raciocínio científico se baseia na dedução: basicamente, seu teste / lei / teorema é uma regra de implicação , que diz que se você tem a premissa A
, pode concluir B
: A=>B
mas, se não tiver A
, poderá ter B
ou não B
, e ambos os casos são verdadeiros , esse é um dos princípios básicos da inferência / dedução lógica (regra do Modus Ponens). Em outras palavras, se você violar as premissas, o resultado não importa e você não pode deduzir nada .
Lembre-se da tabela binária de implicação:
A B A=>B
F F T
F T T
T F F
T T T
Então, no seu caso, para simplificar, você tem Dependent_Variables => ANOVA_correct
. Agora, se você usar variáveis independentes, assim Dependent_Variables
será False
, a implicação será verdadeira, pois a Dependent_Variables
suposição é violada.
É claro que isso é simplista e, na prática, seu teste ANOVA ainda pode retornar resultados úteis, porque quase sempre existe algum grau de independência entre variáveis dependentes, mas isso dá a você a idéia de por que você simplesmente não pode confiar no teste sem cumprir as premissas. .
No entanto, você também pode usar testes cujas premissas não são satisfeitas pelo original, reduzindo seu problema: relaxando explicitamente a restrição de independência, seu resultado ainda pode ser significativo, mas não garantido (porque seus resultados se aplicam ao problema reduzido, não ao problema completo, para que você não possa traduzir todos os resultados, exceto se puder provar que as restrições adicionais do novo problema não afetam seu teste e, portanto, seus resultados).
Na prática, isso geralmente é usado para modelar dados práticos, usando Naive Bayes, por exemplo, modelando variáveis dependentes (em vez de independentes) usando um modelo que assume variáveis independentes e, surpreendentemente, funciona muitas vezes muito bem e, às vezes, melhor do que modelos de contabilidade para dependências . Você também pode se interessar por esta pergunta sobre como usar o ANOVA quando os dados não atendem exatamente a todas as expectativas .
Para resumir: se você pretende trabalhar com dados práticos e seu objetivo não é provar nenhum resultado científico, mas criar um sistema que funcione (por exemplo, um serviço da Web ou qualquer aplicação prática), a suposição de independência (e talvez outras premissas) pode ser descontraído, mas se você estiver tentando deduzir / provar alguma verdade geral , sempre use testes que matematicamente podem garantir (ou pelo menos com segurança e presunção) que satisfazem todas as premissas .