Resumindo , quanto mais aprendo sobre estatística, menos confio em artigos publicados em meu campo; Simplesmente acredito que os pesquisadores não estão fazendo suas estatísticas suficientemente bem.
Sou leigo, por assim dizer. Sou formado em biologia, mas não tenho educação formal em estatística ou matemática. Gosto de R e frequentemente faço um esforço para ler (e entender ...) alguns dos fundamentos teóricos dos métodos que aplico ao fazer pesquisas. Não me surpreenderia se a maioria das pessoas que hoje faz análises não é formalmente treinada. Eu publiquei cerca de 20 artigos originais, alguns dos quais foram aceitos por periódicos e estatísticos reconhecidos frequentemente envolvidos no processo de revisão. Minhas análises geralmente incluem análise de sobrevivência, regressão linear, regressão logística, modelos mistos. Nunca um revisor perguntou sobre premissas, adequação ou avaliação do modelo.
Portanto, nunca me preocupei muito com suposições, ajuste e avaliação do modelo. Começo com uma hipótese, executo a regressão e depois apresento os resultados. Em alguns casos, fiz um esforço para avaliar essas coisas, mas sempre acabava com " bem, não cumpria todas as suposições, mas confio nos resultados (" conhecimento do assunto ") e eles são plausíveis, então tudo bem " e ao consultar um estatístico, eles sempre pareciam concordar.
Agora, conversei com outros estatísticos e não estatísticos (químicos, médicos e biólogos) que realizam análises eles mesmos; parece que as pessoas realmente não se preocupam muito com todas essas suposições e avaliações formais. Mas aqui no CV, há uma abundância de pessoas perguntando sobre resíduos, ajuste do modelo, maneiras de avaliá-lo, autovalores, vetores e a lista continua. Deixe-me colocar desta maneira, quando o lme4 avisa sobre grandes valores próprios, duvido muito que muitos de seus usuários se importem em resolver isso ...
Vale a pena o esforço extra? Não é provável que a maioria de todos os resultados publicados não respeite essas suposições e talvez nem sequer as tenha avaliado? Provavelmente, esse é um problema crescente, uma vez que os bancos de dados aumentam a cada dia e existe a noção de que quanto maiores os dados, menos importantes são as suposições e avaliações.
Eu poderia estar absolutamente errado, mas é assim que eu percebi isso.
Atualização: Citação emprestada do StasK (abaixo): http://www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15509