Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Escolhendo o alfa ideal na regressão logística líquida elástica
Estou executando uma regressão logística de rede elástica em um conjunto de dados de assistência médica usando o glmnetpacote em R selecionando valores lambda em uma grade de de 0 a 1. Meu código abreviado está abaixo:αα\alpha alphalist <- seq(0,1,by=0.1) elasticnet <- lapply(alphalist, function(a){ cv.glmnet(x, y, alpha=a, family="binomial", lambda.min.ratio=.001) }) …


3
Por que Lars e Glmnet oferecem soluções diferentes para o problema do laço?
Eu quero entender melhor os pacotes R Larse Glmnet, que são usados ​​para resolver o problema de Lasso: (parapVariáveis ​​eamostras deN, consultewww.stanford.edu/~hastie/Papers/glmnet.pdfna página 3)m i n( β0 0β) ∈ Rp + 1[ 12 N∑i = 1N( yEu- β0 0- xTEuβ)2+ λ | | β| |eu1]mEun(β0 0β)∈Rp+1[12N∑Eu=1N(yEu-β0 0-xEuTβ)2+λ||β||eu1]min_{(\beta_0 \beta) \in R^{p+1}} …

8
Execute o agrupamento K-means (ou seus parentes próximos) com apenas uma matriz de distância, não dados de pontos por recurso
Quero executar o agrupamento K-means nos objetos que tenho, mas os objetos não são descritos como pontos no espaço, ou seja, por objects x featuresconjunto de dados. No entanto, sou capaz de calcular a distância entre dois objetos (ela se baseia em uma função de similaridade). Então, eu descarto a …






4
Quando são aplicáveis ​​os resultados de Shao na validação cruzada de exclusão única?
Em seu artigo Seleção de modelo linear por validação cruzada , Jun Shao mostra que, para o problema de seleção de variáveis ​​na regressão linear multivariada, o método de validação cruzada de sobreaquecimento (LOOCV) é 'assintoticamente inconsistente'. Em inglês simples, ele tende a selecionar modelos com muitas variáveis. Em um …

3
O formato da imagem (png, jpg, gif) afeta a forma como uma rede neural de reconhecimento de imagem é treinada?
Estou ciente de que houve muitos avanços no que diz respeito ao reconhecimento de imagens, classificação de imagens etc. com redes neurais profundas e convolucionais. Mas se eu treinar uma rede, digamos, em imagens PNG, funcionará apenas para imagens tão codificadas? Que outras propriedades da imagem afetam isso? (canal alfa, …


5
Pressupostos de modelos lineares e o que fazer se os resíduos não forem normalmente distribuídos
Estou um pouco confuso sobre quais são os pressupostos da regressão linear. Até agora, verifiquei se: todas as variáveis ​​explicativas se correlacionaram linearmente com a variável resposta. (Esse foi o caso) houve colinearidade entre as variáveis ​​explicativas. (houve pouca colinearidade). as distâncias de Cook dos pontos de dados do meu …

2
Como agrupar séries temporais?
Eu tenho uma pergunta sobre análise de cluster. Existem 3000 empresas, que precisam ser agrupadas de acordo com o uso de energia ao longo de 5 anos. Cada empresa possui valores para cada hora durante 5 anos. Gostaria de descobrir se algumas empresas têm o mesmo padrão de uso de …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.