Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Entendendo o valor-p
Eu sei que existem muitos materiais que explicam o valor p. No entanto, o conceito não é fácil de entender com firmeza sem maiores esclarecimentos. Aqui está a definição de p-value da Wikipedia: O valor p é a probabilidade de obter uma estatística de teste pelo menos tão extrema quanto …

5
O SVM pode transmitir um aprendizado de exemplo por vez?
Eu tenho um conjunto de dados de streaming, exemplos estão disponíveis um de cada vez. Eu precisaria fazer uma classificação multi-classe neles. Assim que forneço um exemplo de treinamento para o processo de aprendizado, tenho que descartar o exemplo. Simultaneamente, também estou usando o modelo mais recente para realizar previsões …




3
Como ajustar um modelo ARIMAX ao R?
Eu tenho quatro séries temporais diferentes de medições horárias: O consumo de calor dentro de uma casa A temperatura fora de casa A radiação solar A velocidade do vento Quero poder prever o consumo de calor dentro de casa. Existe uma clara tendência sazonal, tanto anualmente como diariamente. Como existe …

4
Origem do limiar de “5
As notícias dizem que o CERN anunciará amanhã que o bóson de Higgs foi detectado experimentalmente com 5 σσ\sigma evidência. Segundo esse artigo: 5 σσ\sigma equivale a 99,9994% de chance dos dados que os detectores CMS e ATLAS estão vendo não são apenas ruídos aleatórios - e 0,00006% de chance …



10
Como ensinar estudantes que temem estatísticas?
Estou prestes a ajudar a ensinar estatística para estudantes de medicina neste semestre. Já ouvi muitas histórias de horror sobre o medo desses alunos ao aprender estatística. Alguém pode sugerir o que fazer com esse medo? (Links para pessoas que estão discutindo isso ou oferecem sugestões de sua própria experiência)
33 teaching 

4
Cluster de erro padrão em R (manualmente ou em plm)
Estou tentando entender o erro padrão "clustering" e como executar no R (é trivial no Stata). No RI, não obtive sucesso usando plmou escrevendo minha própria função. Vou usar os diamondsdados do ggplot2pacote. Eu posso fazer efeitos fixos com variáveis ​​fictícias > library(plyr) > library(ggplot2) > library(lmtest) > library(sandwich) > …

6
Como avaliar a semelhança de dois histogramas?
Dados dois histogramas, como avaliamos se são semelhantes ou não? É suficiente simplesmente olhar para os dois histogramas? O mapeamento simples de um para um tem o problema de que, se um histograma for ligeiramente diferente e ligeiramente alterado, não obteremos o resultado desejado. Alguma sugestão?

3
Qual é a maneira mais precisa de determinar a cor de um objeto?
Eu escrevi um programa de computador que pode detectar moedas em uma imagem estática (.jpeg, .png, etc.) usando algumas técnicas padrão de visão computacional (Gaussian Blur, limiar, Hough-Transform etc.). Usando as proporções das moedas retiradas de uma determinada imagem, posso estabelecer com certeza quais são as moedas. No entanto, desejo …


1
Diferenças matemáticas entre GBM, XGBoost, LightGBM, CatBoost?
Existem várias implementações da família de modelos GBDT, como: GBM XGBoost LightGBM Catboost. Quais são as diferenças matemáticas entre essas diferentes implementações? O Catboost parece ter um desempenho superior às outras implementações, mesmo usando apenas seus parâmetros padrão de acordo com essa marca de referência , mas ainda é muito …
33 boosting  xgboost 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.