Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

1
As splines podem ser usadas para previsão?
Não posso ser específico sobre a natureza dos dados, pois são proprietários, mas suponha que tenhamos dados como este: a cada mês, algumas pessoas se inscrevem em um serviço. Então, em cada mês subsequente, essas pessoas podem atualizar o serviço, interromper o serviço ou ser-lhe negado o serviço (por exemplo, …





4
Livros didáticos sobre cálculo de matriz?
Veja esta pergunta no Math SE . Resumindo: li Os elementos do aprendizado estatístico e fiquei frustrado quando estava tentando verificar alguns dos resultados, por exemplo, dado então RSS ( β) = ( y - X β)T( y - X β) ,RSS(β)=(y-Xβ)T(y-Xβ),\text{RSS}(\beta) = \left(\mathbf{y}-\mathbf{X}\beta\right)^{T}\left(\mathbf{y}-\mathbf{X}\beta\right)\text{,} Estou procurando um livro de cálculo …

1
O paradoxo de Stein ainda se mantém ao usar a norma
O Paradoxo de Stein mostra que, quando três ou mais parâmetros são estimados simultaneamente, existem estimadores combinados mais precisos em média (ou seja, com menor erro quadrado médio esperado) do que qualquer método que lide com os parâmetros separadamente. Este é um resultado muito contra-intuitivo. O mesmo resultado é válido …

5
Ainda precisamos fazer a seleção de recursos enquanto usamos algoritmos de Regularização?
Eu tenho uma pergunta com relação à necessidade de usar métodos de seleção de recursos (florestas aleatórias apresentam valor de importância ou métodos de seleção de recursos univariados etc.) antes de executar um algoritmo de aprendizado estatístico. Sabemos que, para evitar ajustes excessivos, podemos introduzir penalidades de regularização nos vetores …


1
Exemplos reais de processos de decisão de Markov
Eu assisti muitos vídeos tutoriais e eles têm a mesma aparência. Este, por exemplo: https://www.youtube.com/watch?v=ip4iSMRW5X4 Eles explicam estados, ações e probabilidades que estão bem. A pessoa explica tudo bem, mas eu simplesmente não consigo entender o que seria usado na vida real. Ainda não encontrei nenhuma lista. O mais comum …

1
O que é o "efeito ferradura" e / ou o "efeito arco" na análise PCA / correspondência?
Existem muitas técnicas em estatísticas ecológicas para análise exploratória de dados multidimensionais. Essas são chamadas técnicas de 'ordenação'. Muitos são iguais ou estão intimamente relacionados a técnicas comuns em outras partes da estatística. Talvez o exemplo prototípico seja a análise de componentes principais (PCA). Os ecologistas podem usar o PCA …


1
O desempenho de última geração relatado do uso de vetores de parágrafo para análise de sentimentos foi replicado?
Fiquei impressionado com os resultados no artigo da ICML 2014 " Representações distribuídas de frases e documentos " de Le e Mikolov. A técnica que eles descrevem, denominada "vetores de parágrafos", aprende representações não supervisionadas de parágrafos / documentos arbitrariamente longos, com base em uma extensão do modelo word2vec. O …


2
Como interpretar esses gráficos acf e pacf
A seguir, são apresentados os gráficos acf e pacf de uma série de dados mensal. O segundo gráfico é acf com ci.type = 'ma': A persistência de valores altos no gráfico ACF provavelmente representa uma tendência positiva a longo prazo. A questão é se isso representa variação sazonal? Tentei ver …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.