Perguntas com a marcação «dataset»

As solicitações de conjuntos de dados não são abordadas neste site. Use esta tag para perguntas relacionadas à criação, processamento ou manutenção de conjuntos de dados.

2
Os dados de treinamento estão desequilibrados - mas meu conjunto de validação também deve ser?
Eu rotulei dados compostos por 10000 exemplos positivos e 50000 exemplos negativos, fornecendo um total de 60000 exemplos. Obviamente esses dados estão desequilibrados. Agora, digamos que quero criar meu conjunto de validação e quero usar 10% dos meus dados para fazer isso. Minha pergunta é a seguinte: Devo garantir que …




1
Você sinalizaria esses dados como fraudulentos?
Vamos supor que você tenha recebido alguns dados de um delineamento de blocos casualizados com 4 repetições e 23 tratamentos. Após uma inspeção inicial dos dados, você percebe que, durante 8 tratamentos, todas as repetições são idênticas, o que está obviamente errado. Após relatar o problema, você será informado de …

2
Problemas com detecção de outlier
Em um post do blog, Andrew Gelman escreve : A regressão passo a passo é uma dessas coisas, como detecção externa e gráficos de pizza, que parecem populares entre os não estatísticos, mas são considerados pelos estatísticos uma piada. Entendo a referência aos gráficos de setores circulares, mas por que …

2
Análise dos dados rotacionais da roda de hamster
Antes de postar esta pergunta, naveguei por outras perguntas neste Stack, e isso provavelmente será um passeio no parque para quem lê! Mas a descrição deste Stack inclui análise e visualização de dados, então espero que este esteja no lugar certo! </preapology> Estou usando um Raspberry Pi com um ímã …


2
Função de probabilidade de dados truncados
Estou com problemas para entender o conceito e a derivação da probabilidade de dados truncados. Por exemplo, se eu quiser encontrar a função de probabilidade com base em uma amostra de uma distribuição, mas ao retirar uma amostra da distribuição, observo os valores truncados (onde há um corte de , …

1
Intervalos de confiança ao usar o teorema de Bayes
Estou computando algumas probabilidades condicionais e intervalos de confiança associados a 95%. Para muitos de meus casos, tenho contagens diretas de xsucessos fora dos ntestes (de uma tabela de contingência), para que eu possa usar um intervalo de confiança binomial, como é fornecido por binom.confint(x, n, method='exact')in R. Em outros …

1
Como gerar uma boa tabela de resumo?
Quero que R exiba os dados que ele fornece da summary()função em uma tabela para que eu possa compartilhar isso facilmente. Atualmente, estou apenas fazendo summary()no console e, em seguida, tirando uma captura de tela, mas eu prefiro que isso seja gerado como uma boa tabela, como todos os meus …

2
Conjuntos de dados de jogos de computador
Eu estava procurando por conjuntos de dados de jogos de computador, mas até agora só consegui encontrar o conjunto de dados 'Avatar History' para o WoW. Existem outros conjuntos de dados interessantes por aí, possivelmente para outros gêneros?

1
O que esse borrão ao redor da linha significa neste gráfico?
Eu estava brincando com o ggplot2 usando os seguintes comandos para ajustar uma linha aos meus dados: ggplot(data=datNorm, aes(x=Num, y=Val)) + geom_point() + stat_summary(fun.data = "mean_cl_boot", geom="errorbar", colour="red", width=0.8) + stat_sum_single(median) + stat_sum_single(mean, colour="blue") + geom_smooth(level = 0.95, aes(group=1), method="lm") Os pontos vermelhos são valores medianos, o azul é a …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.