Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

4
Diferença entre análise de regressão e análise de variância?
Esta pergunta foi migrada do Mathematics Stack Exchange porque pode ser respondida em Validação cruzada. Migrou há 7 anos . Estou aprendendo agora sobre análise de regressão e análise de variância. Na análise de regressão, você tem uma variável fixa e deseja saber como a variável vai com a outra …
21 regression 


1
Diagnóstico residual em modelos de regressão baseados em MCMC
Recentemente, eu comecei a ajustar modelos mistos de regressão na estrutura bayesiana, usando um algoritmo MCMC (função MCMCglmm em R, na verdade). Acredito ter entendido como diagnosticar a convergência do processo de estimativa (traço, gráfico de geweke, autocorrelação, distribuição posterior ...). Uma das coisas que me impressiona na estrutura bayesiana …

1
Como posso alinhar / sincronizar dois sinais?
Estou fazendo alguma pesquisa, mas fiquei paralisado na fase de análise (deveria ter prestado mais atenção às minhas aulas de estatísticas). Eu coletei dois sinais simultâneos: vazão integrada para volume e alteração na expansão torácica. Eu gostaria de comparar os sinais e, finalmente, esperar obter volume do sinal de expansão …

3
Modelos de empilhamento / montagem com circunflexo
Costumo me encontrar treinando vários modelos preditivos diferentes usando caretem R. Vou treiná-los todos nas mesmas dobras de validação cruzada, usando caret::: createFoldse depois escolho o melhor modelo com base em erro de validação cruzada. No entanto, a previsão mediana de vários modelos geralmente supera o melhor modelo único em …
21 r  caret  ensemble 




3
Primeiro passo para big data (
Suponha que você esteja analisando um enorme conjunto de dados na ordem de bilhões de observações por dia, em que cada observação possui algumas milhares de variáveis ​​numéricas e categoriais esparsas e possivelmente redundantes. Digamos que exista um problema de regressão, um problema de classificação binária desequilibrada e uma tarefa …

1
Ao fazer Markov campos aleatórios
Em seu livro, Modelos Gráficos, Famílias Exponenciais e Inferência Variacional , M. Jordan e M. Wainwright discutem a conexão entre famílias Exponenciais e Campos Aleatórios de Markov (modelos gráficos não direcionados). Estou tentando entender melhor o relacionamento entre eles com as seguintes perguntas: Todos os MRFs são membros das famílias …

2
“Intenção do investigador” e limiares / valores-p
Estou lendo os slides "Doing Bayesian Data Analysis" de John Kruschke , mas na verdade tenho uma pergunta sobre sua interpretação dos testes t e / ou toda a estrutura de testes de significância de hipóteses nulas. Ele argumenta que os valores de p estão mal definidos porque dependem das …





Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.