Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados




5
Qual é a diferença entre NaN e NA?
Gostaria de saber por que algumas línguas como R têm NA e NaN. Quais são as diferenças ou são igualmente iguais? É realmente necessário ter NA?
48 r 

7
O qui-quadrado é sempre um teste unilateral?
Um artigo publicado ( pdf ) contém estas 2 frases: Além disso, a declaração incorreta pode ser causada pela aplicação de regras incorretas ou pela falta de conhecimento do teste estatístico. Por exemplo, o df total em uma ANOVA pode ser considerado o erro df no relatório de um teste …

17
Qual é o seu blog favorito de visualização de dados?
Qual é o melhor blog sobre visualização de dados? Estou fazendo desta pergunta um wiki da comunidade, pois é altamente subjetivo. Limite cada resposta a um link. Observe os seguintes critérios para as respostas propostas: [A] respostas aceitáveis ​​para perguntas como essa ... precisam fornecer descrições adequadas e justificativa fundamentada. …








1
Como aplicar a padronização / normalização ao treinamento e ao conjunto de testes se a previsão é o objetivo?
Transformo todos os meus dados ou dobras (se o CV for aplicado) ao mesmo tempo? por exemplo (allData - mean(allData)) / sd(allData) Transformo trainset e testset separadamente? por exemplo (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Ou eu transformo o trainset e uso cálculos no testset? por …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.