Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


5
Redes neurais modernas que constroem sua própria topologia
Uma limitação dos algoritmos de rede neural padrão (como backprop) é que você precisa tomar uma decisão de design de quantas camadas ocultas e neurônios por camada deseja. Geralmente, a taxa de aprendizagem e a generalização são altamente sensíveis a essas opções. Esta foi a razão pela qual algoritmos de …

6
Exemplos de problemas ocultos de modelos de Markov?
Eu li bastante modelos de Markov ocultos e pude codificar uma versão bastante básica dele. Mas há duas maneiras principais que pareço aprender. Um é ler e implementá-lo no código (o que é feito) e o segundo é entender como isso se aplica em diferentes situações (para que eu possa …

3
Regressão vs. discrepância ANOVA (aov vs lm em R)
Eu sempre tive a impressão de que a regressão é apenas uma forma mais geral de ANOVA e que os resultados seriam idênticos. Recentemente, no entanto, executei uma regressão e uma ANOVA nos mesmos dados e os resultados diferem significativamente. Ou seja, no modelo de regressão, os efeitos principais e …
21 r  regression  anova 



4
Qual é a maldição da dimensionalidade?
Especificamente, estou procurando referências (papéis, livros) que mostrem e expliquem rigorosamente a maldição da dimensionalidade. Essa questão surgiu depois que comecei a ler este white paper de Lafferty e Wasserman. No terceiro parágrafo, eles mencionam uma equação "bem conhecida" que implica que a melhor taxa de convergência é ; se …
21 theory 

3
Por que devemos nos preocupar com a mistura rápida nas cadeias MCMC?
Ao trabalhar com a cadeia de Markov Monte Carlo para extrair inferência, precisamos de uma cadeia que se misture rapidamente, ou seja, mova rapidamente o suporte da distribuição posterior. Mas não entendo por que precisamos dessa propriedade, porque, pelo que entendi, o candiado aceito deve e se concentrará na parte …
21 mcmc 


4
O que significa "imparcialidade"?
O que significa dizer que "a variação é um estimador tendencioso". O que significa converter uma estimativa tendenciosa em uma estimativa imparcial por meio de uma fórmula simples. O que essa conversão faz exatamente? Além disso, qual é o uso prático dessa conversão? Você converte essas pontuações ao usar certo …


1
Cálculo eficiente da matriz inversa em R
Eu preciso calcular a matriz inversa e tenho usado a solvefunção. Embora funcione bem em matrizes pequenas, solvetende a ser muito lento em matrizes grandes. Eu queria saber se existe alguma outra função ou combinação de funções (por meio de SVD, QR, LU ou outras funções de decomposição) que possa …

1
Regressão logística para séries temporais
Eu gostaria de usar um modelo de regressão logística binária no contexto de streaming de dados (séries temporais multidimensionais) para prever o valor da variável dependente dos dados (ou seja, linha) que acabou de chegar, dadas as observações anteriores. Até onde eu sei, a regressão logística é tradicionalmente usada para …

5
Como começar a aplicar a teoria da resposta ao item e qual software usar?
Contexto Eu tenho lido sobre a teoria da resposta ao item e acho fascinante. Acredito que compreendo o básico, mas fiquei me perguntando como aplicar técnicas estatísticas relacionadas à área. Abaixo estão dois artigos semelhantes à área em que gostaria de aplicar o ITR: http://www.jstor.org/stable/4640738?seq=7 http://www.ncbi.nlm.nih.gov/pubmed/21744971 O segundo é o …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.