Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


2
O que o valor do logit realmente significa?
Eu tenho um modelo de logit que cria um número entre 0 e 1 para muitos casos, mas como podemos interpretar isso? Vamos dar um caso com um logit de 0,20 Podemos afirmar que há 20% de probabilidade de um caso pertencer ao grupo B versus ao grupo A? essa …

5
Inclusão da variável dependente defasada na regressão
Estou muito confuso sobre se é legítimo incluir uma variável dependente defasada em um modelo de regressão. Basicamente, acho que se esse modelo se concentrar no relacionamento entre a mudança em Y e outras variáveis ​​independentes, a adição de uma variável dependente defasada no lado direito pode garantir que o …



2
Em circunflexo, qual é a diferença real entre cv e repeatcv?
Isso é semelhante à pergunta dos métodos de re-amostragem da Caret , embora isso nunca tenha respondido a essa parte da pergunta de maneira acordada. A função de trem do cursor oferece cve repeatedcv. Qual é a diferença em dizer fazendo: MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) vs MyTrainControl=trainControl( …

4
Prever com recursos contínuos e categóricos
Algumas técnicas de modelagem preditiva são mais projetadas para manipular preditores contínuos, enquanto outras são melhores para manipular variáveis ​​categóricas ou discretas. É claro que existem técnicas para transformar um tipo em outro (discretização, variáveis ​​dummy, etc.). No entanto, existem técnicas de modelagem preditiva projetadas para manipular os dois tipos …

1
PCA, LDA, CCA e PLS
Como estão relacionados o PCA, LDA, CCA e PLS? Todos eles parecem algébricos "espectrais" e lineares e muito bem compreendidos (digamos, mais de 50 anos de teoria construídos em torno deles). Eles são usados ​​para coisas muito diferentes (PCA para redução de dimensionalidade, LDA para classificação, PLS para regressão), mas …

6
Estimando o mesmo modelo em várias séries temporais
Tenho formação iniciante em séries temporais (algumas estimativas / previsões do ARIMA) e estou enfrentando um problema que não entendo completamente. Qualquer ajuda seria muito apreciada. Estou analisando várias séries temporais, no mesmo intervalo de tempo e na mesma frequência, todas descrevendo um tipo semelhante de dados. Cada série é …




4
Número de características vs. número de observações
Existem documentos / livros / idéias sobre a relação entre o número de características e o número de observações necessárias para treinar um classificador "robusto"? Por exemplo, suponha que eu tenha 1000 recursos e 10 observações de duas classes como um conjunto de treinamento e 10 outras observações como um …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.