Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

20
Existem bons filmes envolvendo matemática ou probabilidade?
Você pode sugerir alguns bons filmes que envolvem matemática, probabilidades etc.? Um exemplo é 21 . Eu também estaria interessado em filmes que envolvem algoritmos (por exemplo, descriptografia de texto). Em geral, filmes "nerds" com teorias científicas famosas, mas nenhuma ficção científica ou documentário. Desde já, obrigado!

3
Qual é a distribuição da distância euclidiana entre duas variáveis ​​aleatórias normalmente distribuídas?
Assuma que são dadas dois objectos cujas localizações exacta é desconhecida, mas está distribuído de acordo com a distribuição normal com parâmetros conhecidos (por exemplo, e . Podemos assumir que ambos são normais bivariados, de modo que as posições são descritas por uma distribuição sobre coordenadas (ie e são vetores …

4
Quais referências devem ser citadas para apoiar o uso de 30 como um tamanho de amostra suficientemente grande?
Eu já li / ouvi muitas vezes que o tamanho da amostra de pelo menos 30 unidades é considerado como "amostra grande" (suposições de normalidade de médias geralmente se mantêm devido ao CLT, ...). Portanto, em meus experimentos, eu normalmente gero amostras de 30 unidades. Você pode me dar alguma …




1
Como interpretar medidas de erro?
Estou executando o classify no Weka para um determinado conjunto de dados e notei que, se estou tentando prever um valor nominal, a saída mostra especificamente os valores previstos correta e incorretamente. No entanto, agora estou executando-o para um atributo numérico e a saída é: Correlation coefficient 0.3305 Mean absolute …



3
Como posso calcular
Suponha que e sejam função de densidade e função de distribuição da distribuição normal padrão.ϕ ( ⋅ )ϕ(⋅)\phi(\cdot)Φ ( ⋅ )Φ(⋅)\Phi(\cdot) Como se pode calcular a integral: ∫∞- ∞Φ ( w - umb) ϕ(w)d w∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw

9
Como interpretar os valores da medida F?
Eu gostaria de saber como interpretar uma diferença dos valores da medida f. Sei que f-measure é uma média equilibrada entre precisão e recordação, mas estou perguntando sobre o significado prático de uma diferença nas medidas f. Por exemplo, se um classificador C1 tem uma precisão de 0,4 e outro …

5
Qual é a diferença entre as pontuações de propensão e a adição de covariáveis ​​em uma regressão e quando elas são preferidas a esta?
Admito que sou relativamente novo em escores de propensão e análise causal. Uma coisa que não é óbvia para mim como iniciante é como o "equilíbrio" usando escores de propensão é matematicamente diferente do que acontece quando adicionamos covariáveis ​​em uma regressão? O que há de diferente na operação e …

1
Qual a diferença entre softmax_cross_entropy_with_logits e softmax_cross_entropy_with_logits_v2?
Especificamente, suponho que me pergunto sobre essa afirmação: As principais versões futuras do TensorFlow permitirão que os gradientes fluam para a entrada de etiquetas no backprop por padrão. O que é mostrado quando eu uso tf.nn.softmax_cross_entropy_with_logits. Na mesma mensagem, exorta-me a dar uma olhada tf.nn.softmax_cross_entropy_with_logits_v2. Examinei a documentação, mas apenas …

6
Random Forest - Como lidar com o excesso de ajustes
Tenho formação em ciência da computação, mas estou tentando me ensinar ciência de dados resolvendo problemas na internet. Eu tenho trabalhado nesse problema nas últimas duas semanas (aproximadamente 900 linhas e 10 recursos). Eu estava inicialmente usando regressão logística, mas agora mudei para florestas aleatórias. Quando executo meu modelo de …

4
Regressão logística em R (Odds Ratio)
Estou tentando realizar uma análise de regressão logística R. Eu participei de cursos que cobrem este material usando o STATA. Estou achando muito difícil replicar a funcionalidade no R. É maduro nesta área? Parece haver pouca documentação ou orientação disponível. A produção do odds ratio parece exigir a instalação epicalce …
41 r  logistic  odds-ratio 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.