Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


3
Os CDFs são mais fundamentais que os PDFs?
Meu professor de estatística disse basicamente que, se receber um dos três seguintes, você poderá encontrar os outros dois: Função de distribuição cumulativa Função Geradora de Momento Função densidade de probabilidade Mas meu professor de econometria disse que os CDFs são mais fundamentais que os PDFs, porque há exemplos em …
43 probability  pdf  cdf  mgf 



3
Camada Softmax em uma rede neural
Estou tentando adicionar uma camada softmax a uma rede neural treinada com retropropagação, então estou tentando calcular seu gradiente. A saída do softmax é hj=ezj∑ezihj=ezj∑ezih_j = \frac{e^{z_j}}{\sum{e^{z_i}}} , ondejjjé o número de neurónios de saída. Se eu der, então eu recebo ∂hj∂zj=hj(1−hj)∂hj∂zj=hj(1−hj)\frac{\partial{h_j}}{\partial{z_j}}=h_j(1-h_j) Semelhante à regressão logística. No entanto, isso está …

2
Suposições aleatórias da floresta
Eu sou uma espécie de floresta aleatória, então ainda estou lutando com alguns conceitos básicos. Na regressão linear, assumimos observações independentes, variação constante… Quais são as suposições / hipóteses básicas que fazemos quando usamos floresta aleatória? Quais são as principais diferenças entre floresta aleatória e bayes ingênuos em termos de …



4
Como comparar estatisticamente duas séries temporais?
Eu tenho duas séries temporais, mostradas na plotagem abaixo: O gráfico mostra os detalhes completos das duas séries temporais, mas posso reduzi-lo facilmente a apenas as observações coincidentes, se necessário. Minha pergunta é: Quais métodos estatísticos posso usar para avaliar as diferenças entre as séries temporais? Sei que essa é …
43 r  time-series 

5
Regressão quando os resíduos de OLS normalmente não são distribuídos
Existem vários tópicos neste site que discutem como determinar se os resíduos do OLS são normalmente distribuídos normalmente assintoticamente . Outra maneira de avaliar a normalidade dos resíduos com o código R é fornecida nesta excelente resposta . Esta é outra discussão sobre a diferença prática entre resíduos padronizados e …

4
Compêndio de técnicas de validação cruzada
Gostaria de saber se alguém conhece um compêndio de técnicas de validação cruzada com uma discussão das diferenças entre eles e um guia sobre quando usar cada um deles. A Wikipedia possui uma lista das técnicas mais comuns, mas estou curioso para saber se existem outras técnicas e se existem …

5
Números aleatórios uniformes falsos: mais uniformemente distribuídos que os dados uniformes verdadeiros
Estou procurando uma maneira de gerar números aleatórios que pareçam ser distribuídos uniformemente - e todos os testes mostrarão que eles são uniformes - exceto que eles são distribuídos de maneira mais uniforme que os dados uniformes verdadeiros . O problema que tenho com os randoms uniformes "verdadeiros" é que …


3
Revendo estatísticas em trabalhos
Para alguns de nós, a arbitragem de papéis faz parte do trabalho. Ao revisar artigos de metodologia estatística, acho que conselhos de outras áreas são bastante úteis, como ciência da computação e matemática . Esta questão diz respeito à revisão de artigos estatísticos mais aplicados. Com isso, quero dizer, o …
43 journals  referee 

4
O que é diferença-em-diferenças?
A diferença nas diferenças há muito é popular como uma ferramenta não experimental, especialmente em economia. Alguém pode fornecer uma resposta clara e não técnica para as seguintes perguntas sobre diferença de diferença. O que é um estimador de diferença de diferença? Por que um estimador de diferença de diferença …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.