Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados




4
Ziliak (2011) se opõe ao uso de valores-p e menciona algumas alternativas; o que eles são?
Em um artigo recente que discute os deméritos de confiar no valor-p da inferência estatística, chamado "Matrixx vs. Siracusano e Student vs. Fisher, Estatística significante no julgamento" (DOI: 10.1111 / j.1740-9713.2011.00511.x), Stephen T. Ziliak se opõe ao uso de valores-p. Nos parágrafos finais, ele diz: Os dados são a única …

6
Quais são as boas técnicas de visualização de dados para comparar distribuições?
Estou escrevendo minha tese de doutorado e percebi que confio excessivamente em gráficos de caixas para comparar distribuições. Quais outras alternativas você gosta para realizar essa tarefa? Também gostaria de perguntar se você conhece algum outro recurso, como a galeria R, na qual eu possa me inspirar com diferentes idéias …




4
Abordando a incerteza do modelo
Fiquei imaginando como os bayesianos da comunidade CrossValidated veem o problema da incerteza do modelo e como preferem lidar com isso. Vou tentar colocar minha pergunta em duas partes: Qual a importância (na sua experiência / opinião) é lidar com a incerteza do modelo? Não encontrei nenhum documento que lide …


2
O PCA é instável sob multicolinearidade?
Eu sei que em uma situação de regressão, se você tem um conjunto de variáveis ​​altamente correlacionadas, isso geralmente é "ruim" devido à instabilidade nos coeficientes estimados (a variação vai para o infinito, enquanto o determinante vai para zero). Minha pergunta é se essa "maldade" persiste em uma situação de …

2
Quando * não * devo usar a função nlm de R para o MLE?
Encontrei alguns guias sugerindo que eu use o nlm de R para estimar a probabilidade máxima. Mas nenhum deles (incluindo a documentação de R ) fornece muita orientação teórica para quando usar ou não a função. Até onde eu sei, o nlm está apenas descendo gradualmente ao longo das linhas …

2
Teste da razão de verossimilhança em R
Suponha que eu faça uma regressão logística univariada em várias variáveis ​​independentes, como esta: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) Fiz uma comparação de modelo (teste de razão de verossimilhança) para ver se o modelo é melhor que o modelo nulo por …
25 r  logistic  diagnostic 


4
Colaboração estatística
Como biólogo, muitos dos projetos de pesquisa em que trabalho em algum momento envolvem colaboração com um estatístico, seja para conselhos simples ou para implementar e testar um modelo para meus dados. Meus colegas de estatística admitem que fazem uma quantidade significativa de colaboração, na medida em que o processo …
25 academia 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.