Estatísticas e Big Data statistical-significance

3

Por que os erros do tipo II nos testes de hipóteses são considerados erros?

Estou lendo sobre erros de decisão no teste de hipóteses. Minha pergunta é por que um "erro tipo II" é considerado algum erro? Pelo que entendi, surge quando deixamos de rejeitar uma hipótese nula falsa. Quando falhamos em rejeitar a hipótese nula, significa simplesmente que não temos fortes evidências para …

8 hypothesis-testing statistical-significance p-value

4

É realista que todas as variáveis sejam altamente significativas em um modelo de regressão múltipla?

Quero regredir a economia de combustível no deslocamento do motor, tipo de combustível, tração nas duas rodas vs. 4 rodas, potência, transmissão manual vs. automática e número de velocidades. Meu conjunto de dados ( link ) contém veículos de 2012 a 2014. fuelEconomy em milhas por galão engineDisplacement: tamanho do …

8 r statistical-significance multiple-regression interpretation

1

Como reformular estatisticamente esta pergunta

Estou analisando um conjunto de dados contendo observações de n número de tentativas dos jogadores em um jogo. Se estou construindo um modelo de regressão para prever o resultado de cada tentativa, com 1 ou mais descritores em relação à tentativa de cada jogador , como posso medir quantas tentativas …

8 regression statistical-significance bayesian p-value sequence-analysis

3

Como executar SVD para atribuir valores ausentes, um exemplo concreto

Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz …

8 r missing-data data-imputation svd sampling matlab mcmc importance-sampling predictive-models prediction algorithms graphical-model graph-theory r regression regression-coefficients r-squared r regression modeling confounding residuals fitting glmm zero-inflation overdispersion optimization curve-fitting regression time-series order-statistics bayesian prior uninformative-prior probability discrete-data kolmogorov-smirnov r data-visualization histogram dimensionality-reduction classification clustering accuracy semi-supervised labeling state-space-models t-test biostatistics paired-comparisons paired-data bioinformatics regression logistic multiple-regression mixed-model random-effects-model neural-networks error-propagation numerical-integration time-series missing-data data-imputation probability self-study combinatorics survival cox-model statistical-significance wilcoxon-mann-whitney hypothesis-testing distributions normal-distribution variance t-distribution probability simulation random-walk diffusion hypothesis-testing z-test hypothesis-testing data-transformation lognormal r regression agreement-statistics classification svm mixed-model non-independent observational-study goodness-of-fit residuals confirmatory-factor neural-networks deep-learning

5

Por que os regressores irrelevantes se tornam estatisticamente significativos em amostras grandes?

Estou tentando entender melhor a significância estatística, os tamanhos dos efeitos e similares. Tenho uma percepção (talvez errada) de que mesmo regressores irrelevantes geralmente se tornam estatisticamente significativos em grandes amostras . Por irrelevante, quero dizer que não há explicação no assunto por que o regressor deve estar relacionado à …

8 regression statistical-significance effect-size large-data

1

Devo verificar o escore z se o valor de p de I de Moran local for significativo?

O conjunto de dados que estou usando contém dados de renda por área. Os valores não são normalmente distribuídos conforme mostrado no diagrama a seguir. O I global de Moran indica padrões espaciais significativos e o I local de Moran encontra pontos quentes e frios significativos (de acordo com o …

8 statistical-significance autocorrelation spatial

1

R - power.prop.test, prop.test e tamanhos de amostra desiguais nos testes A / B

Digamos que eu queira saber qual o tamanho da amostra necessário para um experimento em que estou procurando determinar se a diferença nas duas proporções de sucesso é estatisticamente significativa. Aqui está o meu processo atual: Veja os dados históricos para estabelecer previsões de linha de base. Diga que, no …

8 r hypothesis-testing statistical-significance proportion

2

O valor p também é a taxa de descoberta falsa?

Em http://surveyanalysis.org/wiki/Multiple_Comparisons_(Post_Hoc_Testing) , afirma Por exemplo, se tivermos um valor p de 0,05 e concluirmos que é significativo, a probabilidade de uma descoberta falsa é, por definição, 0,05. Minha pergunta: sempre achei que a descoberta falsa é um erro do tipo I, que é igual aos níveis de significância escolhidos …

8 hypothesis-testing statistical-significance p-value false-discovery-rate type-i-and-ii-errors

2

Por que um modelo estatístico superajustaria se recebesse um grande conjunto de dados?

Meu projeto atual pode exigir que eu construa um modelo para prever o comportamento de um determinado grupo de pessoas. o conjunto de dados de treinamento contém apenas 6 variáveis (id é apenas para fins de identificação): id, age, income, gender, job category, monthly spend em que monthly spendé a …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

2

Quando n aumenta, o valor t aumenta em um teste de hipótese, mas a tabela t é exatamente o oposto. Por quê?

A fórmula para em um teste de hipótese é dada por: t = ˉ X - μtttt = X¯- μσ^/ n--√.t=X¯−μσ^/n. t=\frac{\bar{X}-\mu}{\hat \sigma/\sqrt{n}}. Quando aumenta, o valor aumenta de acordo com a fórmula acima. Mas por que o valor crítico diminui na tabela medida que (que é uma função de …

8 hypothesis-testing self-study statistical-significance t-test t-distribution

2

Combinação de valores p de diferentes testes estatísticos aplicados nos mesmos dados

Embora o título da pergunta pareça trivial, gostaria de explicar que não é tão trivial no sentido de que é diferente da questão de aplicar o mesmo teste estatístico em conjuntos de dados semelhantes para testar contra uma hipótese nula total (meta-análise, por exemplo, usando o método de Fisher para …

8 hypothesis-testing probability statistical-significance multiple-comparisons p-value

3

Como testar se a variação de duas distribuições é diferente se as distribuições não são normais

Estou estudando duas populações geograficamente isoladas da mesma espécie. Inspecionando as distribuições, vejo que ambas são bimodais (há certa sazonalidade em sua ocorrência), mas os picos em uma população são muito mais altos e mais estreitos (ou seja, a variação dos picos locais é menor). Que tipo de teste estatístico …

8 distributions statistical-significance variance

2

Como comparar estatisticamente dois algoritmos em três conjuntos de dados na seleção e classificação de recursos?

Antecedentes do problema: Como parte da minha pesquisa, escrevi dois algoritmos que podem selecionar um conjunto de recursos de um conjunto de dados (dados de expressão gênica de pacientes com câncer). Esses recursos são então testados para ver quão bem eles podem classificar uma amostra invisível como câncer ou não-câncer. …

8 machine-learning statistical-significance computational-statistics standardization genetic-algorithms

2

Estimando o sucesso comparativo de diferentes brochuras

O problema do mundo real Um dos meus clientes está se preparando para enviar uma mala direta para sua lista de usuários inscritos, e esse desafio estatístico surgiu. Sua equipe de marketing possui três brochuras diferentes e deseja saber qual brochura obtém a maior taxa de resposta. Eles também gostariam …

8 hypothesis-testing anova statistical-significance

3

Teste post hoc em uma ANOVA de design misto 2x3 usando SPSS?

Eu tenho dois grupos de 10 participantes que foram avaliados três vezes durante um experimento. Para testar as diferenças entre os grupos e nas três avaliações, executei um ANOVA de desenho misto 2x3 com group(controle, experimental), time(primeiro, segundo, três) e group x time. Ambos timee groupresultaram significativos, além de haver …

8 anova mixed-model spss post-hoc bonferroni time-series unevenly-spaced-time-series classification normal-distribution discriminant-analysis probability normal-distribution estimation sampling classification svm terminology pivot-table random-generation self-study estimation sampling estimation categorical-data maximum-likelihood excel least-squares instrumental-variables 2sls total-least-squares correlation self-study variance unbiased-estimator bayesian mixed-model ancova statistical-significance references p-value fishers-exact probability monte-carlo particle-filter logistic predictive-models modeling interaction survey hypothesis-testing multiple-regression regression variance data-transformation residuals minitab r time-series forecasting arima garch correlation estimation least-squares bias pca predictive-models genetics sem partial-least-squares nonparametric ordinal-data wilcoxon-mann-whitney bonferroni wilcoxon-signed-rank traminer regression econometrics standard-error robust misspecification r probability logistic generalized-linear-model r-squared effect-size gee ordered-logit bayesian classification svm kernel-trick nonlinear bayesian pca dimensionality-reduction eigenvalues probability distributions mathematical-statistics estimation nonparametric kernel-smoothing expected-value filter mse time-series correlation data-visualization clustering estimation predictive-models recommender-system sparse hypothesis-testing data-transformation parametric probability summations correlation pearson-r spearman-rho bayesian replicability dimensionality-reduction discriminant-analysis outliers weka

Perguntas com a marcação «statistical-significance»