Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Interpretando a plotagem de resíduos versus valores ajustados para verificar as suposições de um modelo linear
Considere a figura a seguir dos Modelos Lineares de Faraway com R (2005, p. 59). O primeiro gráfico parece indicar que os resíduos e os valores ajustados não estão correlacionados, pois deveriam estar em um modelo linear homoscedástico com erros normalmente distribuídos. Portanto, as segunda e terceira parcelas, que parecem …



2
Quais são as diferenças práticas entre os procedimentos de taxa de descoberta falsa de Benjamini e Hochberg (1995) e Benjamini e Yekutieli (2001)?
Meu programa de estatística implementa os procedimentos de Benjamini & Hochberg (1995) e Benjamini & Yekutieli (2001) taxa de descoberta falsa (FDR). Fiz o possível para ler o artigo posterior, mas ele é matematicamente denso e não estou razoavelmente certo de que entendo a diferença entre os procedimentos. Eu posso …


2
Seleção de modelos e validação cruzada: o caminho certo
Existem vários threads no CrossValidated no tópico seleção de modelo e validação cruzada. Aqui estão alguns: Validação cruzada interna x externa e seleção de modelo A melhor resposta de @ DikranMarsupial para Seleção de recursos e validação cruzada No entanto, as respostas para esses encadeamentos são bastante genéricas e destacam …


3
Por que a matriz de correlação precisa ser semi-definida positiva e o que significa ser ou não ser semi-definida positiva?
Tenho pesquisado o significado de propriedade semi-definida positiva de matrizes de correlação ou covariância. Estou procurando qualquer informação sobre Definição de semi-definição positiva; Suas propriedades importantes, implicações práticas; A consequência de ter determinante negativo, impacto na análise multivariada ou nos resultados de simulação, etc.




3
Diferença entre modelos lineares generalizados e modelos mistos lineares generalizados
Eu estou querendo saber quais são as diferenças entre GLMs mistos e não misturados. Por exemplo, no SPSS, o menu suspenso permite que os usuários se ajustem: analyze-> generalized linear models-> generalized linear models & analyze-> mixed models-> generalized linear Eles lidam com valores ausentes de maneira diferente? Minha variável …


5
Você pode se aperfeiçoar treinando algoritmos de aprendizado de máquina usando CV / Bootstrap?
Essa questão pode ser muito aberta para obter uma resposta definitiva, mas espero que não. Algoritmos de aprendizado de máquina, como SVM, GBM, Random Forest etc., geralmente possuem alguns parâmetros livres que, além de algumas orientações básicas, precisam ser ajustados para cada conjunto de dados. Isso geralmente é feito com …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.