Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


10
Existe alguma base * matemática * para o debate bayesiano x freqüentista?
Diz na Wikipedia que: a matemática [da probabilidade] é amplamente independente de qualquer interpretação da probabilidade. Pergunta: Então, se queremos ser matematicamente corretos, não devemos proibir qualquer interpretação de probabilidade? Ou seja, o bayesiano e o freqüentismo são matematicamente incorretos? Não gosto de filosofia, mas gosto de matemática e quero …






5
Como exatamente os estatísticos concordaram em usar (n-1) como o estimador imparcial da variação populacional sem simulação?
A fórmula para variação da computação possui no denominador:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Eu sempre me perguntei o porquê. No entanto, ler e assistir a alguns bons vídeos sobre "por que" é, ao que parece, é um bom estimador imparcial da variação da população. Enquanto subestima e superestima …

5
Loadings vs autovetores no PCA: quando usar um ou outro?
Na análise de componentes principais (PCA), obtemos autovetores (vetores unitários) e autovalores. Agora, vamos definir loadings como Loadings=Eigenvectors⋅Eigenvalues−−−−−−−−−−√.Loadings=Eigenvectors⋅Eigenvalues.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. Eu sei que os autovetores são apenas direções e cargas (como definido acima) também incluem variação ao longo dessas direções. Mas, para meu melhor entendimento, gostaria de saber …
67 pca 


1
Que correlação torna uma matriz singular e quais são as implicações da singularidade ou quase singularidade?
Estou fazendo alguns cálculos em diferentes matrizes (principalmente em regressão logística) e geralmente recebo o erro "Matrix is ​​singular", onde tenho que voltar e remover as variáveis ​​correlacionadas. Minha pergunta aqui é o que você consideraria uma matriz correlacionada "altamente"? Existe um valor limite de correlação para representar esta palavra? …


4
Olhe e você encontrará (uma correlação)
Eu tenho várias centenas de medições. Agora, estou pensando em utilizar algum tipo de software para correlacionar todas as medidas com todas as medidas. Isso significa que existem milhares de correlações. Entre eles, deve haver (estatisticamente) uma alta correlação, mesmo que os dados sejam completamente aleatórios (cada medida possui apenas …

7
Quanto pagar? Um problema prático
Esta não é uma questão de trabalho doméstico, mas um problema real enfrentado por nossa empresa. Muito recentemente (há 2 dias), solicitamos a fabricação de 10000 etiquetas de produtos para um revendedor. Revendedor é uma pessoa independente. Ele recebe as etiquetas fabricadas de fora e a empresa faz o pagamento …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.