Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


1
Modelo de amostragem para dados de crowdsourcing?
Estou trabalhando em um aplicativo de pesquisa de saúde aberto, planejado para ser usado em países em desenvolvimento. A idéia básica é que as entrevistas da pesquisa sejam de crowdsourcing - elas são realizadas por voluntários desorganizados que enviam dados dos formulários das entrevistas realizadas usando seus dispositivos móveis, e …
18 sampling 

1
Testes post-hoc após Kruskal-Wallis: o teste de Dunn ou Bonferroni corrigiu os testes de Mann-Whitney?
Eu tenho alguma variável distribuída não gaussiana e preciso verificar se há diferenças significativas entre os valores dessa variável em 5 grupos diferentes. Realizei a análise de variância unidirecional de Kruskal-Wallis (que foi significativa) e depois tive que verificar quais grupos eram significativamente diferentes. Como os grupos são classificados (os …

3
A soma das variáveis ​​aleatórias exponenciais segue Gamma, confusa pelos parâmetros
Aprendi que a soma de variáveis ​​aleatórias exponenciais segue a distribuição gama. Mas em todo lugar que leio a parametrização é diferente. Por exemplo, o Wiki descreve o relacionamento, mas não diga o que seus parâmetros realmente significam? Forma, escala, taxa, 1 / taxa? Distribuição exponencial: ~xxxexp(λ)exp(λ)exp(\lambda) f(x|λ)=λe−λxf(x|λ)=λe−λxf(x|\lambda )=\lambda {{e}^{-\lambda …

2
Por que o Natural Language Processing não se enquadra no domínio Machine Learning? [fechadas]
Atualmente, essa questão não se encaixa no nosso formato de perguntas e respostas. Esperamos que as respostas sejam apoiadas por fatos, referências ou conhecimentos, mas essa pergunta provavelmente solicitará debate, argumentos, pesquisas ou discussão prolongada. Se você acha que essa pergunta pode ser melhorada e possivelmente reaberta, visite o centro …




2
Como posso obter uma ANOVA geral significativa, mas sem diferenças significativas aos pares com o procedimento de Tukey?
Eu realizei com R uma ANOVA e obtive diferenças significativas. No entanto, ao verificar quais pares eram significativamente diferentes usando o procedimento de Tukey, não obtive nenhum deles. Como isso pode ser possível? Aqui está o código: fit5_snow<- lm(Response ~ Stimulus, data=audio_snow) anova(fit5_snow) > anova(fit5_snow) Analysis of Variance Table Response: …



2
Importância variável do GLMNET
Eu estou olhando para usar o laço como um método para selecionar recursos e ajustar um modelo preditivo com um alvo binário. Abaixo está um código com o qual eu estava jogando para testar o método com regressão logística regularizada. Minha pergunta é: recebo um grupo de variáveis ​​"significativas", mas …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.