Como você "controla" um fator / variável?


19

Para meu entendimento, "Controle" pode ter dois significados em estatística.

  1. Grupo controle: em um experimento, nenhum tratamento é dado ao membro do grupo controle. Ex: Placebo vs Droga: Você administra medicamentos para um grupo e não para o outro (controle), também conhecido como "experimento controlado".

  2. Controle para uma variável: Técnica de separar o efeito de uma variável independente específica. Alguns dos outros nomes dados a essas técnicas são "contabilizando", "mantendo constante", "controlando", alguma variável. Por exemplo: em um estudo de visualização de futebol (goste ou não), convém eliminar o efeito de gênero, pois pensamos que o gênero causa viés, ou seja, o homem pode gostar mais do que o sexo feminino.

Então, minha pergunta é para o ponto (2). Duas questões:

Como você "controla" / "considera" variáveis, em geral. Quais técnicas são usadas? (Em termos de regressão, estrutura ANOVA).

No exemplo acima, a escolha de homens e mulheres aleatoriamente constitui controle? Ou seja, a "aleatoriedade" é uma das técnicas para controlar outros efeitos?


3
Em termos de regressão e ANOVA, controlar uma variável geralmente significa que a variável foi incluída no modelo.
Glen

Como diz Glen, incluí-lo no modelo é o caminho a percorrer. No entanto, a randomização é usada para evitar viés de efeitos não incluídos no modelo. Uma vez que um projeto é gerado, muitas vezes as pessoas contrabalançam para garantir coisas como o mesmo número de cada gênero em cada tratamento. O problema de confiar exclusivamente na randomização e no contrapeso é que eles convertem esse viés em variação e, portanto, é mais difícil observar quais dos seus fatores estão ativos.
precisa saber é o seguinte

Respostas:


16

Como já foi dito, controlar geralmente significa incluir uma variável em uma regressão (como apontado pelo @EMS, isso não garante nenhum sucesso em conseguir isso, ele vincula a isso ). Já existem algumas perguntas e respostas altamente votadas sobre esse tópico, como:

As respostas aceitas para essas perguntas são todos muito bons tratamentos para a pergunta que você está fazendo dentro de uma estrutura observacional (eu diria correlacional); mais dessas perguntas podem ser encontradas aqui .

No entanto, você está fazendo sua pergunta especificamente dentro de uma estrutura experimental ou ANOVA, mais algumas reflexões sobre esse tópico podem ser fornecidas.

Dentro de uma estrutura experimental, você controla uma variável aleatoriamente indivíduos (ou outras unidades de observação) nas diferentes condições experimentais. A suposição subjacente é que, como conseqüência, a única diferença entre as condições é o tratamento experimental. Quando aleatoriamente corretamente (ou seja, cada indivíduo tem a mesma chance de estar em cada condição), essa é uma suposição razoável. Além disso, apenas a randomização permite que você faça inferências causais a partir de sua observação, pois essa é a única maneira de garantir que outros fatores não sejam responsáveis ​​por seus resultados.

No entanto, também pode ser necessário controlar variáveis ​​dentro de uma estrutura experimental, ou seja, quando existe outro fator conhecido que também afeta essa variável dependente. Aumentar o poder estatístico e, em seguida, pode ser uma boa idéia controlar essa variável. O procedimento estatístico usual usado para isso é a análise de covariância (ANCOVA), que basicamente também apenas adiciona a variável ao modelo.

Agora vem o ponto crucial: para que a ANCOVA seja razoável, é absolutamente crucial que a atribuição aos grupos seja aleatória e que a covariável para a qual é controlada não esteja correlacionada com a variável de agrupamento.
Infelizmente, isso geralmente é ignorado, levando a resultados ininterpretáveis. Uma introdução realmente legível para esta questão exata (isto é, quando usar ANCOVA ou não) é dada por Miller & Chapman (2001) :

Apesar de inúmeros tratamentos técnicos em muitos locais, a análise de covariância (ANCOVA) continua sendo uma abordagem amplamente utilizada para lidar com diferenças substanciais de grupo em covariáveis ​​em potencial, particularmente em pesquisas em psicopatologia. Os artigos publicados chegam a conclusões infundadas e alguns textos estatísticos negligenciam o assunto. O problema com a ANCOVA nesses casos é revisado. Em muitos casos, não há meios de atingir a meta superficialmente atraente de "corrigir" ou "controlar" as diferenças reais do grupo em uma covariável potencial. Na esperança de reduzir o uso indevido da ANCOVA e promover o uso apropriado, é fornecida uma discussão não técnica, enfatizando uma confusão substantiva raramente articulada em livros didáticos e outras apresentações gerais, para complementar as críticas matemáticas já disponíveis.


Miller, GA, & Chapman, JP (2001). Análise de incompreensão da covariância. Jornal de Psicologia Anormal , 110 (1), 40-48. doi: 10.1037 / 0021-843X.110.1.40


Apenas para enfatizar o ponto dessa pergunta (que é repetida com muita frequência), é bom considerar que simplesmente a inclusão de uma variável em um modelo não garante "controle" de seu efeito, mesmo sob suposições extremamente fortes sobre a variável sendo monotonicamente relacionado à variável dependente. Veja o artigo que está vinculado no meu outro comentário.
Ely

1
@EMS Bom ponto. Eu adicionei uma nota de advertência e seu link para o início do texto. Sinta-se livre para editar meu texto, se achar que há mais para adicionar.
Henrik

0

Para controlar uma variável, é possível igualar dois grupos em uma característica relevante e comparar a diferença no problema que você está pesquisando. Só posso explicar isso com um exemplo, não formalmente, a escola B faz anos no passado, então está lá.

Se você disser:

O Brasil é mais rico que a Suíça porque o Brasil tem uma renda nacional de 3524 bilhões de dólares e a Suíça apenas 551 bilhões

você estaria correto em termos absolutos, mas qualquer pessoa acima de 12 anos com um conhecimento passageiro sobre o mundo suspeitaria que há algo errado com essa afirmação também.

Seria melhor elevar a população de Switzerlands à do Brasil e comparar a renda novamente. Portanto, se a população da Suíça fosse do tamanho do Brasil, sua renda seria:

(210 milhões / 8,5 milhões) * 551 bilhões de dólares = 13612 bilhões de dólares

Isso os torna cerca de quatro vezes mais ricos que o Brasil, com US $ 3524 bilhões.

E sim, você também pode adotar a abordagem per capita, na qual compara a renda média. Mas a abordagem acima, você pode aplicar isso várias vezes.


1
Você parece estar descrevendo alguma forma de normalização, em vez de "controle", no sentido que se quer dizer na pergunta.
whuber

Na verdade, acho que são os mesmos. Se você acha que não, sinta-se à vontade para elaborar a diferença entre os dois
Heccate Newb

Acho que não preciso adicionar as outras respostas que já aparecem neste tópico.
whuber
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.