1. Um famoso exemplo em psicologia e linguística é descrito por Herb Clark (1973; seguindo Coleman, 1964): "A falácia da linguagem como efeito fixo: uma crítica da estatística da linguagem na pesquisa psicológica".
Clark é um psicolinguista que discute experimentos psicológicos nos quais uma amostra de sujeitos da pesquisa responde a um conjunto de materiais de estímulo, geralmente várias palavras extraídas de algum corpus. Ele ressalta que o procedimento estatístico normalmente utilizado nestes casos, com base em medidas repetidas ANOVA, e referido por Clark como , os participantes trata como um fator aleatório, mas (talvez implicitamente) trata os materiais de estímulo (ou "língua") como fixo. Isso leva a problemas na interpretação dos resultados dos testes de hipóteses sobre o fator de condição experimental: naturalmente queremos assumir que um resultado positivo nos diz algo sobre a população da qual extraímos nossa amostra de participantes e também sobre a população teórica da qual extraímos os materiais linguísticos. masF1 1 , tratando os participantes como aleatórios e estímulos como fixos, apenas nos informa sobre o efeito do fator de condição em outros participantes semelhantes que respondemexatamente aos mesmos estímulos. A realização daanálise F 1 , quando os participantes e os estímulos são mais apropriadamente vistos como aleatórios, pode levar a taxas de erro do Tipo 1 que excedem substancialmente onível α nominal- geralmente 0,05 -, dependendo da extensão de fatores como número e variabilidade de estímulos e o desenho do experimento. Nesses casos, a análise mais apropriada, pelo menos sob a estrutura clássica da ANOVA, é usar o que é chamado deestatísticaquase- F com base em razões decombinações lineares deF1 1F1 1αF quadrados médios.
O artigo de Clark causou um surto de psicolinguística na época, mas não conseguiu causar grande impacto na literatura psicológica mais ampla. (E mesmo dentro da psicolinguística, o conselho de Clark ficou um pouco distorcido ao longo dos anos, conforme documentado por Raaijmakers, Schrijnemakers e Gremmen, 1999.) em modelos de efeitos mistos, dos quais o modelo misto clássico ANOVA pode ser visto como um caso especial. Alguns desses trabalhos recentes incluem Baayen, Davidson e Bates (2008), Murayama, Sakaki, Yan e Smith (2014) e ( ahem ) Judd, Westfall e Kenny (2012). Tenho certeza que existem alguns que estou esquecendo.
2. Não exatamente. Não são métodos de começar a se um fator é melhor incluído como um efeito aleatório ou não no modelo em tudo (ver, por exemplo, Pinheiro & Bates, 2000, pp 83-87;. No entanto ver Barr, Levy, Scheepers, & Tily, 2013). E, é claro, existem técnicas clássicas de comparação de modelos para determinar se um fator é melhor incluído como um efeito fixo ou não é de todo (isto é,testes ). Mas acho que determinar se um fator é melhor considerado fixo ou aleatório geralmente é melhor deixar como uma pergunta conceitual, a ser respondida considerando o desenho do estudo e a natureza das conclusões a serem tiradas dele.F
Um dos meus instrutores de estatística, Gary McClelland, gostava de dizer que talvez a questão fundamental da inferência estatística seja: "Comparado a quê?" Seguindo Gary, acho que podemos enquadrar a questão conceitual que mencionei acima como: Qual é a classe de referência dos resultados experimentais hipotéticos com os quais quero comparar meus resultados reais observados? Permanecendo no contexto da psicolinguística e considerando um projeto experimental no qual temos uma amostra de sujeitos respondendo a uma amostra de palavras classificadas em uma das duas condições (o projeto específico discutido longamente por Clark, 1973), focalizarei duas possibilidades:
- O conjunto de experimentos em que, para cada experimento, extraímos uma nova amostra de Sujeitos, uma nova amostra de Palavras e uma nova amostra de erros do modelo generativo. Sob esse modelo, assuntos e palavras são efeitos aleatórios.
- O conjunto de experimentos em que, para cada experimento, desenhamos uma nova amostra de Sujeitos e uma nova amostra de erros, mas sempre usamos o mesmo conjunto de Palavras . Sob esse modelo, os sujeitos são efeitos aleatórios, mas as palavras são efeitos fixos.
Para tornar isso totalmente concreto, abaixo estão alguns gráficos de (acima) 4 conjuntos de resultados hipotéticos de 4 experimentos simulados no Modelo 1; (abaixo) 4 conjuntos de resultados hipotéticos de 4 experimentos simulados no Modelo 2. Cada experimento exibe os resultados de duas maneiras: (painéis esquerdos) agrupados por Sujeitos, com os meios Sujeito por Condição plotados e vinculados para cada Sujeito; (painéis à direita) agrupados por Palavras, com gráficos de caixa resumindo a distribuição de respostas para cada Palavra. Todas as experiências envolvem 10 indivíduos que respondem a 10 palavras e em todas as experiências a "hipótese nula" de nenhuma diferença de condição é verdadeira na população relevante.
Temas e Palavras, ambos aleatórios: 4 experimentos simulados
Observe aqui que em cada experimento, os perfis de resposta para os sujeitos e as palavras são totalmente diferentes. Para os sujeitos, às vezes temos respostas gerais baixas, às vezes respostas altas, às vezes assuntos que tendem a mostrar grandes diferenças de condição e, às vezes, assuntos que tendem a mostrar pequena diferença de condição. Da mesma forma, para as Palavras, às vezes recebemos Palavras que tendem a obter respostas baixas, e às vezes Palavras que tendem a obter respostas altas.
Assuntos aleatórios, Palavras corrigidas: 4 experimentos simulados
Observe aqui que, nos 4 experimentos simulados, os sujeitos parecem diferentes a cada vez, mas os perfis de respostas para as palavras parecem basicamente os mesmos, consistentes com a suposição de que estamos reutilizando o mesmo conjunto de palavras para cada experimento nesse modelo.
Nossa escolha de pensar se o Modelo 1 (sujeitos e palavras aleatórios) ou o Modelo 2 (assuntos aleatórios, palavras corrigidas) fornece a classe de referência apropriada para os resultados experimentais que realmente observamos podem fazer uma grande diferença para nossa avaliação de se a manipulação da condição "trabalhou". Esperamos mais variações de chance nos dados no Modelo 1 do que no Modelo 2, porque há mais "partes móveis". Portanto, se as conclusões que desejamos tirar são mais consistentes com as premissas do Modelo 1, onde a variabilidade da chance é relativamente maior, mas analisamos nossos dados sob as premissas do Modelo 2, onde a variabilidade da chance é relativamente menor, nosso erro do Tipo 1 A taxa para testar a diferença de condição será inflada em alguma extensão (possivelmente muito grande). Para mais informações, consulte as referências abaixo.
Referências
Baayen, RH, Davidson, DJ e Bates, DM (2008). Modelagem de efeitos mistos com efeitos aleatórios cruzados para assuntos e itens. Journal of memory and language, 59 (4), 390-412. PDF
Barr, DJ, Levy, R., Scheepers, C., & Tily, HJ (2013). Estrutura de efeitos aleatórios para teste de hipótese confirmatória: Mantenha-o no máximo. Journal of Memory and Language, 68 (3), 255-278. PDF
Clark, HH (1973). A falácia da linguagem como efeito fixo: uma crítica da estatística da linguagem na pesquisa psicológica. Jornal de aprendizagem verbal e comportamento verbal, 12 (4), 335-359. PDF
Coleman, EB (1964). Generalizando para uma população de idiomas. Relatórios Psicológicos, 14 (1), 219-226.
Judd, CM, Westfall, J. & Kenny, DA (2012). Tratar estímulos como um fator aleatório na psicologia social: uma solução nova e abrangente para um problema generalizado, mas amplamente ignorado. Revista de personalidade e psicologia social, 103 (1), 54. PDF
Murayama, K., Sakaki, M., Yan, VX e Smith, GM (2014). Inflação de erro tipo I na análise tradicional por participante com precisão metamemória: uma perspectiva generalizada do modelo de efeitos mistos. Jornal de Psicologia Experimental: Aprendizagem, Memória e Cognição. PDF
Pinheiro, JC, & Bates, DM (2000). Modelos de efeitos mistos em S e S-PLUS. Springer.
Raaijmakers, JG, Schrijnemakers, J., & Gremmen, F. (1999). Como lidar com “a falácia do idioma como efeito fixo”: equívocos comuns e soluções alternativas. Journal of Memory and Language, 41 (3), 416-426. PDF