Gosto do livro de G van Belle sobre Regras de Estatística , e em menor grau Erros Comuns em Estatística (e Como Evitá-las) de Phillip I Good e James W. Hardin. Eles abordam as armadilhas comuns na interpretação dos resultados de estudos experimentais e observacionais e fornecem recomendações práticas para inferência estatística ou análise exploratória de dados. Mas sinto que faltam diretrizes "modernas", especialmente com o crescente uso de estatísticas computacionais e robustas em vários campos, ou a introdução de técnicas da comunidade de aprendizado de máquina em, por exemplo, bioestatística clínica ou epidemiologia genética.
Além dos truques computacionais ou das armadilhas comuns na visualização de dados que poderiam ser abordadas em outros lugares, gostaria de perguntar: Quais são as principais regras práticas que você recomendaria para uma análise eficiente dos dados? ( uma regra por resposta, por favor ).
Estou pensando nas diretrizes que você pode fornecer a um colega, a um pesquisador sem formação sólida em modelagem estatística ou a um aluno do curso intermediário ao avançado. Isso pode pertencer a vários estágios da análise de dados, por exemplo, estratégias de amostragem, seleção de recursos ou construção de modelos, comparação de modelos, pós-estimativa, etc.