Não tenho certeza de onde essa pergunta pertence: Validação cruzada ou Local de trabalho. Mas minha pergunta está vagamente relacionada à estatística.
Esta questão (ou acho que perguntas) surgiu durante o meu trabalho como "estagiário de ciência de dados". Eu estava construindo esse modelo de regressão linear e examinando o gráfico residual. Vi sinais claros de heterocedasticidade. Lembro que a heterocedasticidade distorce muitas estatísticas de teste, como intervalo de confiança e teste t. Então, usei o quadrado mínimo ponderado, seguindo o que aprendi na faculdade. Meu gerente viu isso e me aconselhou a não fazer isso porque "eu estava complicando as coisas", o que não era uma razão muito convincente para mim.
Outro exemplo seria "remover uma variável explicativa, pois seu valor-p é insignificante". Sendo assim, esse conselho simplesmente não faz sentido do ponto de vista lógico. De acordo com o que aprendi, o valor p insignificante pode ser devido a diferentes razões: chance, usar o modelo errado, violar as premissas etc.
Outro exemplo é que usei a validação cruzada com dobras k para avaliar meu modelo. De acordo com o resultado, o é bem melhor que o . Mas temos um mais baixo para o modelo 1, e o motivo tem algo a ver com a interceptação . Meu supervisor, no entanto, parece preferir o modelo 2 porque possui mais alto . Suas razões (como são robustas, ou validação cruzada é uma abordagem de aprendizado de máquina, não uma abordagem estatística) simplesmente não parecem convincentes o suficiente para mudar de idéia. C V m o d e l 2 R 2R 2
Como alguém que acabou de se formar na faculdade, estou muito confuso. Sou muito apaixonado por aplicar estatísticas corretas para resolver problemas do mundo real, mas não sei qual das seguintes afirmações é verdadeira:
- As estatísticas que aprendi sozinho estão erradas, por isso estou cometendo erros.
- Há uma enorme diferença entre estatísticas teóricas e modelos de construção nas empresas. E embora a teoria estatística esteja certa, as pessoas simplesmente não a seguem.
- O gerente não está usando as estatísticas corretamente.
Atualização em 17/04/2017: Decidi fazer um doutorado. nas estatísticas. Obrigado a todos pela sua resposta.