Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

5
Exemplos de PCA em que PCs com baixa variação são "úteis"
Normalmente, na análise de componentes principais (PCA), os primeiros PCs são usados ​​e os PCs de baixa variância são descartados, pois não explicam grande parte da variação nos dados. No entanto, existem exemplos em que os PCs de baixa variação são úteis (ou seja, são utilizados no contexto dos dados, …
24 pca 



3
Validação cruzada ou bootstrapping para avaliar o desempenho da classificação?
Qual é o método de amostragem mais apropriado para avaliar o desempenho de um classificador em um conjunto de dados específico e compará-lo com outros classificadores? A validação cruzada parece ser uma prática padrão, mas li que métodos como o .632 bootstrap são uma opção melhor. Como acompanhamento: A escolha …


2
Qual o tamanho necessário de um conjunto de treinamento?
Existe um método comum usado para determinar quantas amostras de treinamento são necessárias para treinar um classificador (neste caso, uma LDA) para obter uma precisão mínima de generalização de limite? Estou perguntando, porque gostaria de minimizar o tempo de calibração normalmente necessário em uma interface cérebro-computador.

2
Como projetar e implementar uma função de perda assimétrica para regressão?
Problema Na regressão, geralmente calcula-se o erro quadrático médio (MSE) de uma amostra: para medir a qualidade de um preditor.MSE=1n∑i=1n(g(xi)−gˆ(xi))2MSE=1n∑i=1n(g(xi)−g^(xi))2 \text{MSE} = \frac{1}{n} \sum_{i=1}^n\left(g(x_i) - \widehat{g}(x_i)\right)^2 No momento, estou trabalhando em um problema de regressão em que o objetivo é prever o preço que os clientes estão dispostos a pagar …




1
Intervalo de previsão de regressão linear
Se a melhor aproximação linear (usando mínimos quadrados) dos meus pontos de dados é a linha y=mx+by=mx+by=mx+b , como posso calcular o erro de aproximação? Se o cálculo do desvio padrão da diferença entre as observações e previsões ei=real(xi)−(mxi+b)ei=real(xi)−(mxi+b)e_i=real(x_i)-(mx_i+b) , que pode depois dizer que uma verdadeira (mas não observado) …





Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.