Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Combinando informações de vários estudos para estimar a média e a variação de dados normalmente distribuídos - abordagens Bayesianas vs meta-analíticas
Revi um conjunto de artigos, cada um relatando a média e o DP observados de uma medida de em sua respectiva amostra de tamanho conhecido, . Quero fazer o melhor palpite possível sobre a provável distribuição da mesma medida em um novo estudo que estou projetando e quanta incerteza existe …


2
soma das variáveis ​​aleatórias qui-quadrado não centrais
Preciso encontrar a distribuição da variável aleatória Y=∑i = 1n(XEu)2Y=∑Eu=1n(XEu)2Y=\sum_{i=1}^{n}(X_i)^2 onde XEu∼ N( μEu, σ2Eu)XEu∼N(μEu,σEu2)X_i\sim{\cal{N}}(\mu_i,\sigma^2_i) e todos os XEuXEuX_i s são independentes. Eu sei que é possível a primeira a encontrar o produto de todas as funções de geração de momento para a XEuXEuX_i s, e depois transformar de volta …


5
Floresta aleatória vs regressão
Eu executei um modelo de regressão OLS no conjunto de dados com 5 variáveis ​​independentes. As variáveis ​​independentes e a variável dependente são contínuas e estão relacionadas linearmente. OR Square é de cerca de 99,3%. Mas quando eu executo o mesmo usando floresta aleatória em R, meu resultado é '% …

1
Detectando outliers em dados de contagem
Eu tenho o que eu ingenuamente pensei ser um problema bastante direto que envolve a detecção de valores extremos para muitos conjuntos diferentes de dados de contagem. Especificamente, quero determinar se um ou mais valores em uma série de dados de contagem são maiores ou menores que o esperado em …


4
Imputação múltipla e seleção de modelo
A imputação múltipla é bastante direta quando você tem um modelo linear a priori que deseja estimar. No entanto, as coisas parecem um pouco mais complicadas quando você realmente deseja fazer uma seleção de modelo (por exemplo, encontre o "melhor" conjunto de variáveis ​​preditoras a partir de um conjunto maior …

1
Quais são algumas melhorias bem conhecidas sobre os algoritmos MCMC de livros didáticos que as pessoas usam para inferência bayesiana?
Quando estou codificando uma simulação de Monte Carlo para algum problema, e o modelo é bastante simples, utilizo uma amostra básica de Gibbs do livro didático. Quando não é possível usar a amostra de Gibbs, codifico o livro Metropolis-Hastings que aprendi anos atrás. O único pensamento que dou é escolher …







Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.