Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

3
Armadilhas de modelos lineares mistos
Quais são algumas das principais armadilhas do uso de modelos lineares de efeitos mistos? Quais são as coisas mais importantes a serem testadas / observadas na avaliação da adequação do seu modelo? Ao comparar modelos do mesmo conjunto de dados, quais são as coisas mais importantes a serem procuradas?

5
Essa quantidade relacionada à independência tem um nome?
Obviamente, os eventos A e B são independentes se Pr = Pr Pr . Vamos definir uma quantidade relacionada Q:(A∩B)(A∩B)(A\cap B)(A)(A)(A)(B)(B)(B) Q≡Pr(A∩B)Pr(A)Pr(B)Q≡Pr(A∩B)Pr(A)Pr(B)Q\equiv\frac{\mathrm{Pr}(A\cap B)}{\mathrm{Pr}(A)\mathrm{Pr}(B)} Então A e B são independentes se Q = 1 (assumindo que o denominador é diferente de zero). Q realmente tem um nome? Eu sinto que isso …


10
Conjuntos de dados de redes sociais
Bloqueado . Esta pergunta e suas respostas estão bloqueadas porque a questão está fora do tópico, mas tem um significado histórico. No momento, não está aceitando novas respostas ou interações. Estou procurando conjuntos de dados de redes sociais (twitter, friendfeed, facebook, lastfm etc.) para tarefas de classificação, de preferência no …



5
Artigos essenciais sobre decomposições matriciais
Recentemente, li o livro de Skillicorn sobre decomposições matriciais e fiquei um pouco decepcionado, pois era direcionado a um público de graduação. Gostaria de compilar (para mim e para os outros) uma breve bibliografia de artigos essenciais (pesquisas, mas também artigos inovadores) sobre decomposições matriciais. O que eu tenho em …

4
Posso simplesmente remover uma das duas variáveis ​​preditivas altamente correlacionadas linearmente?
Usando o coeficiente de correlação de Pearson, tenho várias variáveis ​​altamente correlacionadas ( e para 2 pares de variáveis ​​que estão no meu modelo).ρ=0.978ρ=0.978\rho = 0.978ρ=0.989ρ=0,989\rho = 0.989 O motivo pelo qual algumas das variáveis ​​são altamente correlacionadas é porque uma variável é usada no cálculo para outra variável. Exemplo: …

4
Propriedades de média e mediana
Alguém pode me explicar a lógica matemática que ligaria duas afirmações (a) e (b)? Vamos ter um conjunto de valores (alguma distribuição). Agora, a) A mediana não depende de todo valor [depende apenas de um ou dois valores médios]; b) Mediana é o lugar geométrico da soma mínima dos desvios …

5
Usando lmer para previsão
Olá, tenho dois problemas que parecem candidatos naturais a modelos multiníveis / mistos, que nunca usei. O mais simples, e que espero tentar como introdução, é o seguinte: Os dados se parecem com muitas linhas do formulário x y innergroup outergroup onde x é uma covariável numérica na qual desejo …

4
Remoção de bordas nos gráficos R para alcançar o eixo do Tufte
Bloqueado . Esta pergunta e suas respostas estão bloqueadas porque a questão está fora do tópico, mas tem um significado histórico. No momento, não está aceitando novas respostas ou interações. Considere o seguinte gráfico: x <- 1:100 y1 <- rnorm(100) y2 <- rnorm(100)+100 par(mar=c(5,5,5,5)) plot(x,y1,pch=0,type="b",col="red",yaxt="n",ylim=c(-8,2),ylab="") axis(side=2, at=c(-2,0,2)) mtext("red line", side …


1
Eu calculei essas taxas de probabilidade corretamente?
Sou o autor do pacote ez para R e estou trabalhando em uma atualização para incluir o cálculo automático das taxas de verossimilhança (LRs) na saída de ANOVAs. A idéia é fornecer uma LR para cada efeito que seja análogo ao teste desse efeito que a ANOVA alcança. Por exemplo, …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.