Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados




2
Regressão de Bayes: como é feita em comparação com a regressão padrão?
Eu tenho algumas perguntas sobre a regressão bayesiana: Dada uma regressão padrão como . Se eu quiser mudar isso para uma regressão bayesiana, preciso de distribuições anteriores para e (ou não funciona dessa maneira)?y=β0+β1x+εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 Na regressão padrão, tentaria-se minimizar os resíduos para obter …

3
Quando as escalas de log são apropriadas?
Eu li que o uso de escalas de log quando gráficos / gráficos é apropriado em determinadas circunstâncias, como o eixo y em um gráfico de séries temporais. No entanto, não consegui encontrar uma explicação definitiva sobre por que esse é o caso, ou quando mais seria apropriado. Lembre-se de …


3
Por que o desvio padrão da amostra é um estimador enviesado de
De acordo com o artigo da Wikipedia sobre estimativa imparcial do desvio padrão, a amostra DP s=1n−1∑i=1n(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1 1n-1 1∑Eu=1 1n(xEu-x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} é um estimador tendencioso do DP da população. Ele afirma que E(s2−−√)≠E(s2)−−−−−√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} . NB Variáveis ​​aleatórias são independentes e cada xi∼N(μ,σ2)xi∼N(μ,σ2)x_{i} \sim …

9
É errado reformular "1 em 80 mortes é causada por um acidente de carro", pois "1 em cada 80 pessoas morrem como resultado de um acidente de carro?"
Declaração 1 (S1): "Uma em cada 80 mortes é causada por um acidente de carro". Declaração Dois (S2): "Uma em cada 80 pessoas morre como resultado de um acidente de carro". Agora, pessoalmente, não vejo muita diferença entre essas duas afirmações. Ao escrever, eu os consideraria intercambiáveis ​​para um público …

7
Desafios da indústria versus Kaggle. A coleta de mais observações e o acesso a mais variáveis ​​são mais importantes que a modelagem extravagante?
Eu espero que o título seja auto-explicativo. No Kaggle, a maioria dos vencedores usa o empilhamento com algumas vezes centenas de modelos de base, para extrair alguns% extra de MSE, precisão ... Em geral, na sua experiência, o quão importante é a modelagem sofisticada, como empilhar versus simplesmente coletar mais …



1
A regressão logística em R resultou em separação perfeita (fenômeno de Hauck-Donner). O que agora?
Estou tentando prever um resultado binário usando 50 variáveis ​​explicativas contínuas (o intervalo da maioria das variáveis ​​é a ). Meu conjunto de dados tem quase 24.000 linhas. Quando corro no R, recebo:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically 0 or 1 occurred …


8
Bibliotecas R para aprendizado profundo
Eu queria saber se existem boas bibliotecas R por aí para redes neurais de aprendizado profundo? Eu sei que existe o nnet,, neuralnete RSNNS, mas nenhum deles parece implementar métodos de aprendizado profundo. Estou especialmente interessado em não supervisionado, seguido de aprendizado supervisionado e no uso da evasão para impedir …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.