Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Como faz sentido executar o OLS após a seleção de variáveis ​​do LASSO?
Recentemente, descobri que na literatura econométrica aplicada, ao lidar com problemas de seleção de características, não é incomum executar o LASSO seguido de uma regressão OLS usando as variáveis ​​selecionadas. Fiquei me perguntando como podemos qualificar a validade de tal procedimento. Causará problemas como variáveis ​​omitidas? Alguma prova mostrando que …

4
Diferença entre feedback RNN ​​e LSTM / GRU
Estou tentando entender diferentes arquiteturas de redes neurais recorrentes (RNN) a serem aplicadas a dados de séries temporais e estou ficando um pouco confuso com os diferentes nomes que são frequentemente usados ​​ao descrever RNNs. A estrutura da Memória de Longo Prazo (LSTM) e da Unidade Recorrente Fechada (GRU) é …

2
Da distribuição uniforme à distribuição exponencial e vice-versa
Esta é provavelmente uma questão trivial, mas minha busca foi infrutífera até agora, incluindo este artigo wikipedia , e o "Compêndio de Distribuições" documento . Se tem uma distribuição uniforme, significa que segue uma distribuição exponencial?XXXeXeXe^X Da mesma forma, se segue uma distribuição exponencial, significa que segue uma distribuição uniforme?YYYln(Y)ln(Y)ln(Y)



2
Nas redes neurais, por que usar métodos de gradiente em vez de outras metaheurísticas?
No treinamento de redes neurais profundas e rasas, por que os métodos de gradiente (por exemplo, descida de gradiente, Nesterov, Newton-Raphson) são comumente usados, em oposição a outras metaheurísticas? Por metaheurísticas, refiro-me a métodos como recozimento simulado, otimização de colônias de formigas etc., que foram desenvolvidos para evitar o empate …




4
Agrupando uma Matriz de Correlação
Eu tenho uma matriz de correlação que indica como cada item é correlacionado com o outro item. Portanto, para um N itens, eu já tenho uma matriz de correlação N * N. Usando essa matriz de correlação, como agrupo os N itens nos compartimentos M para que eu possa dizer …

3
Por que o fator de normalização é necessário no teorema de Bayes?
O teorema de Bayes vai P( modelo | dados ) = P( modelo ) × P( dados | modelo )P( dados )P(modelo|dados)=P(modelo)×P(dados|modelo)P(dados) P(\textrm{model}|\textrm{data}) = \frac{P(\textrm{model}) \times P(\textrm{data}|\textrm{model})}{P(\textrm{data})} Está tudo bem. Mas eu li em algum lugar: Basicamente, P (dados) nada mais é do que uma constante normalizadora, ou seja, uma …



2
Especificando uma Diferença no Modelo de Diferenças com Vários Períodos
Quando eu estimo uma diferença no modelo de diferenças com dois períodos, o modelo de regressão equivalente seria uma. Yist=α+γs∗Treatment+λdt+δ∗(Treatment∗dt)+ϵistYist=α+γs∗Treatment+λdt+δ∗(Treatment∗dt)+ϵistY_{ist} = \alpha +\gamma_s*Treatment + \lambda d_t + \delta*(Treatment*d_t)+ \epsilon_{ist} onde é um manequim que é igual a 1 se a observação é a partir do grupo de tratamentoTreatmentTreatmentTreatment e é …

2
O trem de interpolação funciona para glmnet com validação cruzada para alfa e lambda?
O caretpacote R é validado cruzadamente sobre alphae lambdapara o glmnetmodelo? Executando esse código, eGrid <- expand.grid(.alpha = (1:10) * 0.1, .lambda = (1:10) * 0.1) Control <- trainControl(method = "repeatedcv",repeats = 3,verboseIter =TRUE) netFit <- train(x =train_features, y = y_train, method = "glmnet", tuneGrid = eGrid, trControl = Control) …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.