Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


2
Como interpretar glmnet?
Estou tentando ajustar um modelo de regressão linear multivariada com aproximadamente 60 variáveis ​​preditivas e 30 observações, por isso estou usando o pacote glmnet para regressão regularizada porque p> n. Passei por documentação e outras perguntas, mas ainda não consigo interpretar os resultados, aqui está um código de exemplo (com …


4
Como amostrar de uma distribuição normal com média e variação conhecidas usando uma linguagem de programação convencional?
Eu nunca tive um curso de estatística, então espero estar perguntando no lugar certo aqui. Suponha que eu tenha apenas dois dados descrevendo uma distribuição normal: a média e a variação . Eu quero usar um computador para amostrar aleatoriamente essa distribuição, de modo que eu respeite essas duas estatísticas.σ …

3
Evidência experimental suportando visualizações no estilo Tufte?
P: Existem evidências experimentais que apóiam visualizações minimalistas e de fala de dados no estilo Tufte, em relação às visualizações desorganizadas no gráfico de, digamos, Nigel Holmes ? Perguntei como adicionar lixo gráfico às parcelas de R aqui e os respondentes jogaram uma grande quantidade de piada de volta para …


4
O que é uma variável instrumental?
Variáveis ​​instrumentais estão se tornando cada vez mais comuns em economia aplicada e estatística. Para os não iniciados, podemos ter algumas respostas não técnicas para as seguintes perguntas: O que é uma variável instrumental? Quando alguém iria querer empregar uma variável instrumental? Como alguém encontra ou escolhe uma variável instrumental?

6
Como quase igualar dois vetores de strings (em R)?
Não sei ao certo como isso deve ser denominado; portanto, corrija-me se souber um termo melhor. Eu tenho duas listas. Um dos 55 itens (por exemplo: um vetor de strings) e o outro de 92. Os nomes dos itens são semelhantes, mas não idênticos. Eu gostaria de encontrar o melhor …
36 r  text-mining 


3
Aprendizado de máquina: devo usar uma perda de entropia cruzada categórica ou de entropia cruzada binária para previsões binárias?
Antes de tudo, percebi que, se preciso realizar previsões binárias, tenho que criar pelo menos duas classes executando uma codificação one-hot. Isso está correto? No entanto, a entropia cruzada binária é apenas para previsões com apenas uma classe? Se eu usasse uma perda de entropia cruzada categórica, que normalmente é …

5
A função de custo da rede neural não é convexa?
A função de custo da rede neural é J(W,b)J(W,b)J(W,b) e é reivindicada como não convexa . Não entendo muito bem por que é assim, pois, como vejo, é bastante semelhante à função de custo da regressão logística, certo? Se não for convexa, a derivada de 2ª ordem ∂J∂W<0∂J∂W<0\frac{\partial J}{\partial W} …





Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.