Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

3
Como derivar matriz de variância-covariância de coeficientes em regressão linear
Estou lendo um livro sobre regressão linear e tenho alguns problemas para entender a matriz de variância-covariância de bb\mathbf{b} : Os itens diagonais são fáceis, mas os fora da diagonal são um pouco mais difíceis, o que me intriga é que σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1 \sigma(b_0, b_1) = E(b_0 b_1) - E(b_0)E(b_1) = …
36 regression 

3
Interpretação do valor-p no teste de hipóteses
Recentemente, deparei com o artigo "A Insignificância do Teste de Significância de Hipótese Nula", Jeff Gill (1999) . O autor levantou algumas concepções errôneas comuns sobre testes de hipóteses e valores de p, sobre os quais tenho duas perguntas específicas: O valor p é tecnicamente , que, como apontado pelo …


6
Por que "explicar" faz sentido intuitivamente?
Recentemente, aprendi sobre um princípio do raciocínio probabilístico chamado " explicação " e estou tentando entender uma intuição para isso. Deixe-me montar um cenário. Seja o evento de um terremoto. Seja o evento o evento que o gigante verde alegre passeia pela cidade. Seja o evento que o chão está …

6
Como posso analiticamente provar que dividir aleatoriamente um valor resulta em uma distribuição exponencial (por exemplo, renda e riqueza)?
Neste artigo atual da CIÊNCIA, o seguinte está sendo proposto: Suponha que você divida aleatoriamente 500 milhões de renda entre 10.000 pessoas. Só existe uma maneira de oferecer a todos 50.000 partes iguais. Portanto, se você distribuir ganhos aleatoriamente, a igualdade é extremamente improvável. Mas existem inúmeras maneiras de dar …

4
Bons métodos para gráficos de densidade de variáveis ​​não negativas em R?
plot(density(rexp(100)) Obviamente, toda a densidade à esquerda de zero representa viés. Estou procurando resumir alguns dados para não estatísticos e quero evitar perguntas sobre por que os dados não negativos têm densidade à esquerda de zero. Os gráficos são para verificação aleatória; Quero mostrar as distribuições de variáveis ​​por grupos …






5
Medida de elevação na mineração de dados
Pesquisei muitos sites para saber exatamente o que o elevador fará? Os resultados que encontrei foram sobre o uso em aplicativos e não em si. Eu sei sobre a função de suporte e confiança. Na Wikipedia, na mineração de dados, o lift é uma medida do desempenho de um modelo …

5
Funções de tempo em R [fechado]
Eu gostaria de medir o tempo que leva para repetir a execução de uma função. São replicate()e usando loops for equivalentes? Por exemplo: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); Qual é o método preferido? Na saída de system.time(), é sys+usero tempo real da CPU para executar o programa? É elapseduma boa …
36 r 



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.