Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados






4
Por que os valores p mais baixos não são mais evidências contra o nulo? Argumentos de Johansson 2011
Johansson (2011) em " Salve o impossível: valores-p, evidência e probabilidade " (aqui também está link para o periódico ) afirma que valores- mais pppbaixos são frequentemente considerados como evidência mais forte contra o nulo. Johansson implica que as pessoas considerariam mais forte a evidência contra o nulo se o …

2
Qual é a diferença entre “aprendizado profundo” e modelagem multinível / hierárquica?
"Aprendizado profundo" é apenas outro termo para modelagem multinível / hierárquica? Estou muito mais familiarizado com o último que com o primeiro, mas, pelo que posso dizer, a principal diferença não está na definição deles, mas como eles são usados ​​e avaliados dentro do domínio do aplicativo. Parece que o …

5
Recomendações de cor e espessura da linha para plotagens de linha
Muito foi escrito sobre as opções de cores compatíveis com daltônicos para mapas, polígonos e regiões sombreadas em geral (veja, por exemplo, http://colorbrewer2.org ). Não consegui encontrar recomendações para cores de linha e espessura de linha variável para gráficos de linha. Os objetivos são: distinguir facilmente linhas, mesmo quando elas …

5
Detectando preditores significativos de muitas variáveis ​​independentes
Em um conjunto de dados de duas populações não sobrepostas (pacientes e saudáveis, total ), gostaria de encontrar (de variáveis ​​independentes) preditores significativos para uma variável dependente contínua. Correlação entre preditores está presente. Estou interessado em descobrir se algum dos preditores está relacionado à variável dependente "na realidade" (em vez …




8
Substituindo os valores discrepantes pela média
Esta pergunta foi feita pelo meu amigo que não é conhecedor da Internet. Não tenho antecedentes estatísticos e tenho pesquisado na Internet esta questão. A questão é: é possível substituir os valores discrepantes pelo valor médio? se for possível, existe alguma referência / periódicos para apoiar esta declaração?

1
Redução de dimensionalidade (SVD ou PCA) em uma matriz grande e esparsa
/ editar: Acompanhamento adicional agora você pode usar o irlba :: prcomp_irlba / edit: acompanhando meu próprio post. irlbaagora possui argumentos de "centro" e "escala", que permitem usá-lo para calcular componentes principais, por exemplo: pc <- M %*% irlba(M, nv=5, nu=0, center=colMeans(M), right_only=TRUE)$v Eu tenho um grande número Matrixde recursos …

5
Qual é a diferença entre "valor médio" e "média"?
A Wikipedia explica: Para um conjunto de dados, a média é a soma dos valores divididos pelo número de valores. Essa definição, no entanto, corresponde ao que chamo de "média" (pelo menos é o que me lembro de aprender). No entanto, a Wikipedia mais uma vez cita: Existem outras medidas …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.