Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



7
Quais são os 'grandes problemas' nas estatísticas?
A matemática tem seus famosos problemas do milênio (e, historicamente, os 23 de Hilbert ), questões que ajudaram a moldar a direção do campo. Tenho pouca ideia, no entanto, quais seriam as hipóteses de Riemann e P vs. NP de estatística. Então, quais são as questões abertas abrangentes nas estatísticas? …
77 history 





3
Seleção de recursos e validação cruzada
Recentemente, tenho lido muito neste site (@Aniko, @Dikran Marsupial, @Erik) e em outros lugares sobre o problema de sobreajuste que ocorre com a validação cruzada - (Smialowski et al. 2010 Bioinformatics, Hastie, Elements of statistics learning). A sugestão é que qualquer seleção de recurso supervisionado (usando correlação com rótulos de …






5
Por favor, explique o paradoxo da espera
Alguns anos atrás, projetei um detector de radiação que funciona medindo o intervalo entre os eventos, em vez de contá-los. Minha suposição era que, ao medir amostras não contíguas, em média eu media metade do intervalo real. No entanto, quando testei o circuito com uma fonte calibrada, a leitura era …

3
Diagnósticos para regressão logística?
Para regressão linear, podemos verificar os gráficos de diagnóstico (gráficos de resíduos, gráficos de QQ normal, etc.) para verificar se as suposições de regressão linear são violadas. Para regressão logística, estou tendo problemas para encontrar recursos que expliquem como diagnosticar o ajuste do modelo de regressão logística. Desenterrar algumas notas …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.