Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



1
Como o MANOVA está relacionado ao LDA?
Em vários lugares, vi uma afirmação de que MANOVA é como ANOVA mais análise discriminante linear (LDA), mas sempre foi feita de uma maneira que acenava com as mãos. Eu gostaria de saber o que exatamente isso significa. Encontrei vários livros que descrevem todos os detalhes dos cálculos do MANOVA, …




1
Como lidar com um SVM com atributos categóricos
Eu tenho um espaço de 35 dimensões (atributos). Meu problema analítico é de classificação simples. Das 35 dimensões, mais de 25 são categóricas e cada atributo leva mais de 50 tipos de valores. Nesse cenário, a introdução de uma variável dummy também não funcionará para mim. Como posso executar um …

3
teste t em dados altamente assimétricos
Eu tenho um conjunto de dados com dezenas de milhares de observações de dados de custos médicos. Esses dados são altamente inclinados para a direita e possuem muitos zeros. Parece assim para dois grupos de pessoas (neste caso, duas faixas etárias com> 3000 obs cada): Min. 1st Qu. Median Mean …



4
Como alguém poderia desenvolver uma regra de parada em uma análise de poder de duas proporções independentes?
Sou desenvolvedor de software que trabalha em sistemas de teste A / B. Não tenho um histórico sólido de estatísticas, mas venho adquirindo conhecimento nos últimos meses. Um cenário de teste típico envolve a comparação de dois URLs em um site. Um visitante visita LANDING_URLe é encaminhado aleatoriamente para um …


2
Por que a matriz de informações de Fisher é semidefinida positiva?
Seja θ∈Rnθ∈Rn\theta \in R^{n} . A Matriz de Informações de Fisher é definida como: I(θ)i,j=−E[∂2log(f(X|θ))∂θi∂θj∣∣∣θ]I(θ)i,j=−E[∂2log⁡(f(X|θ))∂θi∂θj|θ]I(\theta)_{i,j} = -E\left[\frac{\partial^{2} \log(f(X|\theta))}{\partial \theta_{i} \partial \theta_{j}}\bigg|\theta\right] Como posso provar que a Matriz de informações de Fisher é semidefinida positiva?

3
Matriz de variância-covariância em lmer
Eu sei que uma das vantagens dos modelos mistos é que eles permitem especificar a matriz de variância-covariância para os dados (simetria composta, auto-regressiva, não estruturada etc.). No entanto, a lmerfunção em R não permite uma especificação fácil dessa matriz. Alguém sabe qual estrutura lmerusa por padrão e por que …

2
Grande desacordo na estimativa de declive quando os grupos são tratados aleatoriamente versus fixados em um modelo misto
Entendo que usamos modelos de efeitos aleatórios (ou efeitos mistos) quando acreditamos que alguns parâmetros do modelo variam aleatoriamente em algum fator de agrupamento. Desejo ajustar um modelo em que a resposta tenha sido normalizada e centralizada (não perfeitamente, mas bastante próxima) em um fator de agrupamento, mas uma variável …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.