Perguntas com a marcação «rule-of-thumb»

Aconselhamento sobre análises estatísticas que são frequentemente úteis na prática (mas nem sempre têm garantia de funcionamento).

24
Regras práticas para estatísticas "modernas"
Gosto do livro de G van Belle sobre Regras de Estatística , e em menor grau Erros Comuns em Estatística (e Como Evitá-las) de Phillip I Good e James W. Hardin. Eles abordam as armadilhas comuns na interpretação dos resultados de estudos experimentais e observacionais e fornecem recomendações práticas para …

8
Cálculo do número ideal de posições em um histograma
Estou interessado em encontrar o melhor método possível para determinar quantas caixas devo usar em um histograma. Meus dados devem variar de 30 a 350 objetos, no máximo, e, em particular, estou tentando aplicar limiar (como o método de Otsu) em que objetos "bons", dos quais eu deveria ter menos …


4
Quais referências devem ser citadas para apoiar o uso de 30 como um tamanho de amostra suficientemente grande?
Eu já li / ouvi muitas vezes que o tamanho da amostra de pelo menos 30 unidades é considerado como "amostra grande" (suposições de normalidade de médias geralmente se mantêm devido ao CLT, ...). Portanto, em meus experimentos, eu normalmente gero amostras de 30 unidades. Você pode me dar alguma …

2
Bom recurso online com dicas sobre associação gráfica entre duas variáveis ​​numéricas sob várias condições
Contexto: Ao longo do tempo, adquiri um conjunto de heurísticas sobre como planejar efetivamente a associação entre duas variáveis ​​numéricas. Eu imagino que a maioria das pessoas que trabalha com dados teria um conjunto de regras semelhante. Exemplos de tais regras podem ser: Se uma das variáveis ​​for inclinada positivamente, …

4
Como projetar um novo vetor no espaço PCA?
Depois de executar a análise de componentes principais (PCA), quero projetar um novo vetor no espaço do PCA (ou seja, encontrar suas coordenadas no sistema de coordenadas do PCA). Eu calculei o PCA na linguagem R usando prcomp. Agora eu devo poder multiplicar meu vetor pela matriz de rotação PCA. …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
Métricas
Alguém usa as métricas ou L .5 para agrupar, em vez de L 2 ? Aggarwal et al., Sobre o surpreendente comportamento das métricas de distância no espaço de alta dimensão, disseram (em 2001) queL1L1L_1L.5L.5L_.5L2L2L_2 é consistentemente mais preferível do que a métrica de distância euclidiana L 2 para aplicações …


1
Tamanho da amostra necessário para determinar qual de um conjunto de anúncios tem a maior taxa de cliques
Sou designer de software por profissão e estou trabalhando em um projeto para um cliente, e gostaria de garantir que minha análise seja estatisticamente correta. Considere o seguinte: Temos n anúncios (n <10) e queremos simplesmente saber qual anúncio apresenta o melhor desempenho. Nosso servidor de anúncios exibirá aleatoriamente um …

4
MANOVA e correlações entre variáveis ​​dependentes: quão forte é muito forte?
As variáveis ​​dependentes em um MANOVA não devem ser "fortemente correlacionadas". Mas quão forte uma correlação é muito forte? Seria interessante obter a opinião das pessoas sobre esse assunto. Por exemplo, você continuaria com o MANOVA nas seguintes situações? Y1 e Y2 são correlacionados com er=0.3r=0.3r=0.3p&lt;0.005p&lt;0.005p<0.005 Y1 e Y2 são …



1
Como se formaliza uma distribuição de probabilidade anterior? Existem regras práticas ou dicas que alguém deve usar?
Embora eu goste de pensar que tenho uma boa compreensão do conceito de informações prévias na análise estatística e na tomada de decisões bayesianas, muitas vezes tenho problemas para entender minha aplicação. Tenho em mente algumas situações que exemplificam minhas lutas e sinto que elas não são abordadas adequadamente nos …


1
Regras fáceis básicas para estatísticas
Em um experimento binomial, se observarmos indivíduo positivo entre indivíduos, a proporção de indivíduos positivos será significativamente menor que com um erro do tipo 1 menor e muito próximo a . Esse fato, às vezes chamado de "regra dos três", é uma conseqüência das desigualdadesx = 0x=0x=0nnn3 / n3/n3/n5 %5%5\%exp( …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.