Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


11
Podcasts estatísticos
Quais são alguns podcasts relacionados à análise estatística? Encontrei algumas gravações em áudio de palestras universitárias no ITunes U, mas não conheço nenhum podcast estatístico. A coisa mais próxima que eu conheço é um podcast de pesquisa operacional The Science of Better . Ele aborda questões estatísticas, mas não é …
29 references 





6
Teste de variância finita?
É possível testar a finitude (ou existência) da variação de uma variável aleatória dada uma amostra? Como nulo, {a variação existe e é finita} ou {a variação não existe / é infinita} seria aceitável. Filosoficamente (e computacionalmente), isso parece muito estranho, porque não deve haver diferença entre uma população sem …

1
Quais são as deficiências do erro médio percentual absoluto (MAPE)?
O erro médio percentual absoluto ( mape ) é uma medida de precisão ou erro comum para séries temporais ou outras previsões, MAPE = 100n∑t = 1n| UMAt- Ft|UMAt% ,MAPE=100n∑t=1n|At−Ft|At%, \text{MAPE} = \frac{100}{n}\sum_{t=1}^n\frac{|A_t-F_t|}{A_t}\%, onde são reais e previsões ou previsões correspondentes.UMAtAtA_tFtFtF_t O MAPE é uma porcentagem, para que possamos compará-lo …
29 accuracy  mape 

3
O que é uma variedade?
Na técnica de redução de dimensionalidade, como Análise de Componentes Principais, LDA etc, geralmente o termo coletor é usado. O que é um coletor em termos não técnicos? Se um ponto pertencer a uma esfera cuja dimensão eu quero reduzir, e se houver um ruído e e não estiverem correlacionados, …

1
Intervalo de previsão de inicialização
Existe alguma técnica de autoinicialização disponível para calcular intervalos de previsão para previsões pontuais obtidas, por exemplo, por regressão linear ou outro método de regressão (k-vizinho mais próximo, árvores de regressão etc.)? De alguma forma, sinto que a maneira às vezes proposta de apenas inicializar a previsão do ponto (veja, …


2
Por que usar a validação cruzada estratificada? Por que isso não prejudica o benefício relacionado à variação?
Disseram-me que é benéfico usar a validação cruzada estratificada, especialmente quando as classes de resposta são desequilibradas. Se um objetivo da validação cruzada é ajudar a explicar a aleatoriedade da nossa amostra de dados de treinamento original, certamente fazer com que cada dobra tenha a mesma distribuição de classe funcionaria …


4
Interpretação Pseudo-R2 de McFadden
Eu tenho um modelo de regressão logística binária com um pseudo-quadrado de McFadden de 0,192 com uma variável dependente chamada pagamento (1 = pagamento e 0 = nenhum pagamento). Qual é a interpretação desse pseudo R-quadrado? É uma comparação relativa para modelos aninhados (por exemplo, um modelo de 6 variáveis …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.