Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Sobre a "força" de alunos fracos
Eu tenho várias perguntas relacionadas a alunos fracos na aprendizagem de grupos (por exemplo, impulsionar). Isso pode parecer idiota, mas quais são os benefícios de usar alunos fracos em oposição a alunos fortes? (por exemplo, por que não aumentar com métodos de aprendizado "fortes"?) Existe algum tipo de força "ideal" …

2
Bom recurso online com dicas sobre associação gráfica entre duas variáveis ​​numéricas sob várias condições
Contexto: Ao longo do tempo, adquiri um conjunto de heurísticas sobre como planejar efetivamente a associação entre duas variáveis ​​numéricas. Eu imagino que a maioria das pessoas que trabalha com dados teria um conjunto de regras semelhante. Exemplos de tais regras podem ser: Se uma das variáveis ​​for inclinada positivamente, …

4
Interpretando a diferença entre a distribuição lognormal e a distribuição de leis de energia (distribuição de graus de rede)
Primeiro, eu não sou estatístico. No entanto, tenho feito análise estatística de redes para meu doutorado. Como parte da análise de rede, plotei uma Função de Distribuição Cumulativa Complementar (CCDF) de graus de rede. O que descobri foi que, diferentemente das distribuições de rede convencionais (por exemplo, WWW), a distribuição …








1
Por que as funções R 'princomp' e 'prcomp' fornecem diferentes autovalores?
Você pode usar o conjunto de dados de decatlo {FactoMineR} para reproduzir isso. A questão é por que os autovalores computados diferem daqueles da matriz de covariância. Aqui estão os autovalores usando princomp: > library(FactoMineR);data(decathlon) > pr <- princomp(decathlon[1:10], cor=F) > pr$sd^2 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 1.348073e+02 2.293556e+01 …
22 r  pca 

2
Sugestões para melhorar uma folha de dicas de probabilidade e estatística
Contexto: Em um esforço para estruturar as peças centrais que encontrei na teoria e na estática das probabilidades, criei um documento de referência focado nos fundamentos matemáticos (disponíveis aqui ). Ao compartilhar este documento, espero fornecer aos estudantes de estatística um resumo abrangente do material principal ensinado nos cursos de …
22 teaching 

4
Como garantir propriedades da matriz de covariância ao ajustar o modelo normal multivariado usando a máxima verossimilhança?
Suponha que eu tenha o seguinte modelo yi=f(xi,θ)+εiyi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i onde , é um vetor de variáveis ​​explicativas, são os parâmetros da função não linear e , onde é naturalmente matriz.yi∈RKyi∈RKy_i\in \mathbb{R}^Kxixix_iθθ\thetafffεi∼N(0,Σ)εi∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma)ΣΣ\SigmaK×KK×KK\times K O objetivo é o usual para estimar e . A escolha óbvia é o método de máxima verossimilhança. …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.