Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


5
Agora que rejeitei a hipótese nula, o que vem a seguir?
Eu tenho uma e outra vez rejeitado ou não rejeitou a hipótese nula. Na falha em rejeitar o caso, você conclui que não há evidências suficientes para rejeição e "segue em frente" (ou seja, reúne mais dados, encerra o experimento etc.) Mas quando você "rejeita" a hipótese nula, fornecendo alguma …

1
Invertendo a Transformada de Fourier para uma distribuição Fisher
A função característica da distribuição de Fisher é: C ( t ) = Γ ( α + 1F(1,α)F(1,α)\mathcal{F}(1,\alpha) ondeUé afunção hipergeométrica confluente. Estou tentando resolver a transformada inversa de FourierF-1t,xdan-convoluçãopara recuperar a densidade de uma variávelx, ou seja: F-1t,x(C(t)n) com o objetivo de obter a distribuição da soma denvariáveis ​​aleatórias …

1
As estatísticas de validação cruzada (CV) e de validação cruzada generalizada (GCV)
Encontrei definições possivelmente conflitantes para a estatística de validação cruzada (CV) e para a estatística de validação cruzada generalizada (GCV) associada a um modelo linear (com um vetor de erro normal e homoscedástico \ símbolo de negrito \ varepsilon ).Y=Xβ+εY=Xβ+εY = X\boldsymbol\beta + \boldsymbol\varepsilonεε\boldsymbol\varepsilon Por um lado, Golub, Heath & …


2
CHAID vs CRT (ou CARRINHO)
Estou executando uma classificação de árvore de decisão usando o SPSS em um conjunto de dados com cerca de 20 preditores (categóricos com poucas categorias). CHAID (Detecção Automática de Interação Qui-Quadrado) e CRT / CART (Árvores de Classificação e Regressão) estão me dando árvores diferentes. Alguém pode explicar os méritos …
23 spss  cart 


3
Estudante t como mistura de gaussiana
Usando a distribuição t do aluno com graus de liberdade, o parâmetro de localização le os parâmetros de escala s têm densidadek > 0k>0k > 0eullsss Γ ( k + 12)Γ ( k2k πs2----√){ 1 + k- 1( x - ls) }- ( k + 1 ) / 2,Γ(k+12)Γ(k2kπs2){1+k−1(x−ls)}−(k+1)/2,\frac{\Gamma \left(\frac{k+1}{2}\right)}{\Gamma\left(\frac{k}{2}\sqrt{k …

2
Como lidar com a diferença entre a distribuição do conjunto de teste e o conjunto de treinamento?
Penso que uma suposição básica de aprendizado de máquina ou estimativa de parâmetros é que os dados invisíveis vêm da mesma distribuição que o conjunto de treinamento. No entanto, em alguns casos práticos, a distribuição do conjunto de testes será quase diferente do conjunto de treinamento. Digamos um problema de …



2
Média de rebatidas bayesianas antes
Eu queria fazer uma pergunta inspirada em uma excelente resposta à pergunta sobre a intuição para a distribuição beta. Eu queria entender melhor a derivação da distribuição anterior da média de rebatidas. Parece que David está fazendo o backup dos parâmetros da média e do intervalo. Supondo que a média …
23 bayesian  prior 



4
Como calcular a distribuição cumulativa em R?
Bloqueado . Esta pergunta e suas respostas estão bloqueadas porque a questão está fora do tópico, mas tem um significado histórico. No momento, não está aceitando novas respostas ou interações. Preciso calcular a função de distribuição cumulativa de uma amostra de dados. Existe algo semelhante ao hist () em R …
23 r  distributions  cdf 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.