Estatísticas e Big Data

10

Qual é a explicação do seu leigo favorito para um conceito estatístico difícil?

Eu realmente gosto de ouvir explicações simples para problemas complexos. Qual é a sua analogia ou anedota favorita que explica um conceito estatístico difícil? Meu favorito é a explicação de Murray sobre cointegração usando um bêbado e seu cachorro. Murray explica como dois processos aleatórios (um bêbado errante e seu …

36 teaching communication

2

Como interpretar glmnet?

Estou tentando ajustar um modelo de regressão linear multivariada com aproximadamente 60 variáveis preditivas e 30 observações, por isso estou usando o pacote glmnet para regressão regularizada porque p> n. Passei por documentação e outras perguntas, mas ainda não consigo interpretar os resultados, aqui está um código de exemplo (com …

36 r regression regularization glmnet

2

Por que a distribuição Dirichlet é anterior à distribuição multinomial?

No algoritmo de modelo de tópico do LDA, vi essa suposição. Mas não sei por que escolheu a distribuição Dirichlet? Não sei se podemos usar a distribuição Uniform sobre Multinomial como um par?

36 bayesian dirichlet-distribution conjugate-prior

4

Como amostrar de uma distribuição normal com média e variação conhecidas usando uma linguagem de programação convencional?

Eu nunca tive um curso de estatística, então espero estar perguntando no lugar certo aqui. Suponha que eu tenha apenas dois dados descrevendo uma distribuição normal: a média e a variação . Eu quero usar um computador para amostrar aleatoriamente essa distribuição, de modo que eu respeite essas duas estatísticas.σ …

36 normal-distribution sampling computing

3

Evidência experimental suportando visualizações no estilo Tufte?

P: Existem evidências experimentais que apóiam visualizações minimalistas e de fala de dados no estilo Tufte, em relação às visualizações desorganizadas no gráfico de, digamos, Nigel Holmes ? Perguntei como adicionar lixo gráfico às parcelas de R aqui e os respondentes jogaram uma grande quantidade de piada de volta para …

36 data-visualization

8

O que é o teorema de Bayes?

Quais são as principais idéias, isto é, conceitos relacionados ao teorema de Bayes ? Não estou pedindo nenhuma derivação de notação matemática complexa.

36 probability bayesian theory

4

O que é uma variável instrumental?

Variáveis instrumentais estão se tornando cada vez mais comuns em economia aplicada e estatística. Para os não iniciados, podemos ter algumas respostas não técnicas para as seguintes perguntas: O que é uma variável instrumental? Quando alguém iria querer empregar uma variável instrumental? Como alguém encontra ou escolhe uma variável instrumental?

36 regression econometrics instrumental-variables

6

Como quase igualar dois vetores de strings (em R)?

Não sei ao certo como isso deve ser denominado; portanto, corrija-me se souber um termo melhor. Eu tenho duas listas. Um dos 55 itens (por exemplo: um vetor de strings) e o outro de 92. Os nomes dos itens são semelhantes, mas não idênticos. Eu gostaria de encontrar o melhor …

36 r text-mining

5

Distribuição de probabilidade para diferentes probabilidades

Se eu quisesse obter a probabilidade de 9 sucessos em 16 tentativas, com cada tentativa tendo 0,6 de probabilidade, eu poderia usar uma distribuição binomial. O que eu poderia usar se cada uma das 16 tentativas tivesse uma probabilidade diferente de sucesso?

36 distributions probability binomial

3

Aprendizado de máquina: devo usar uma perda de entropia cruzada categórica ou de entropia cruzada binária para previsões binárias?

Antes de tudo, percebi que, se preciso realizar previsões binárias, tenho que criar pelo menos duas classes executando uma codificação one-hot. Isso está correto? No entanto, a entropia cruzada binária é apenas para previsões com apenas uma classe? Se eu usasse uma perda de entropia cruzada categórica, que normalmente é …

36 machine-learning neural-networks loss-functions tensorflow cross-entropy

5

A função de custo da rede neural não é convexa?

A função de custo da rede neural é J(W,b)J(W,b)J(W,b) e é reivindicada como não convexa . Não entendo muito bem por que é assim, pois, como vejo, é bastante semelhante à função de custo da regressão logística, certo? Se não for convexa, a derivada de 2ª ordem ∂J∂W<0∂J∂W<0\frac{\partial J}{\partial W} …

36 neural-networks loss-functions

4

Como o SVM pode 'encontrar' um espaço infinito de recursos onde a separação linear é sempre possível?

Qual é a intuição por trás do fato de que um SVM com um Kernel Gaussiano possui um espaço infinito de recursos dimensionais?

36 svm feature-selection kernel-trick

5

Por que os problemas de regressão são chamados de problemas de "regressão"?

Eu só estava me perguntando por que os problemas de regressão são chamados de "regressão". Qual é a história por trás do nome? Uma definição para regressão: "Recaída para um estado menos perfeito ou desenvolvido".

36 regression terminology history etymology

1

Inferência variacional versus MCMC: quando escolher uma sobre a outra?

Eu acho que entendi a ideia geral do VI e do MCMC, incluindo os vários sabores do MCMC, como amostras de Gibbs, Metropolis Hastings etc. Este artigo fornece uma maravilhosa exposição de ambos os métodos. Tenho as seguintes perguntas: Se eu gostaria de fazer inferência bayesiana, por que escolheria um …

36 machine-learning bayesian mcmc variational-bayes approximate-inference

2

Como normalizar dados entre -1 e 1?

Eu vi a fórmula de normalização min-max, mas que normaliza valores entre 0 e 1. Como normalizaria meus dados entre -1 e 1? Eu tenho valores negativos e positivos na minha matriz de dados.

36 dataset normalization