Perguntas com a marcação «multicollinearity»

Situação em que existe forte relação linear entre variáveis ​​preditoras, de modo que sua matriz de correlação se torna (quase) singular. Essa "condição ruim" dificulta a determinação do papel único de cada um dos preditores: surgem problemas de estimativa e aumentam os erros padrão. Preditores correlacionados bivariadamente muito altos são um exemplo de multicolinearidade.

2
A codificação qualitativa de variáveis ​​na regressão leva a "singularidades"
Eu tenho uma variável independente chamada "qualidade"; essa variável possui 3 modalidades de resposta (má qualidade; média qualidade; alta qualidade). Quero introduzir essa variável independente em minha regressão linear múltipla. Quando eu tenho uma variável independente binária (variável dummy, eu posso codificar 0/ 1), é fácil introduzi-la em um modelo …



3
Quando podemos falar de colinearidade
Nos modelos lineares, precisamos verificar se existe um relacionamento entre as variáveis ​​explicativas. Se eles se correlacionam demais, há colinearidade (ou seja, as variáveis ​​se explicam parcialmente). Atualmente, estou apenas olhando para a correlação pareada entre cada uma das variáveis ​​explicativas. Pergunta 1: O que classifica como muita correlação? Por …

1
Por que essa regressão NÃO falha devido à perfeita multicolinearidade, embora uma variável seja uma combinação linear de outras?
Hoje, eu estava brincando com um pequeno conjunto de dados e realizei uma regressão OLS simples que esperava falhar devido à perfeita multicolinearidade. No entanto, não. Isso implica que meu entendimento da multicolinearidade está errado. Minha pergunta é: onde estou errado? Eu acho que posso mostrar que uma das minhas …

1
Qual é a intuição por trás de amostras intercambiáveis ​​sob a hipótese nula?
Os testes de permutação (também chamados de teste de randomização, teste de re-randomização ou teste exato) são muito úteis e úteis quando a suposição de distribuição normal exigida por, por exemplo, t-testnão é atendida e quando a transformação dos valores pela classificação do teste não-paramétrico como Mann-Whitney-U-testlevaria a mais informações …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 


4
Deveria se preocupar com a multicolinearidade ao usar modelos não lineares?
Digamos que temos um problema de classificação binária com recursos principalmente categóricos. Usamos algum modelo não linear (por exemplo, XGBoost ou Random Forests) para aprendê-lo. Ainda se deve preocupar com a multicolinearidade? Por quê? Se a resposta acima for verdadeira, como combatê-la, considerando que estamos usando esses tipos de modelos …

2
Regressão linear quando você conhece apenas , não diretamente
Suponhamos que .Xβ=YXβ=YX\beta =Y Não sabemos exatamente, apenas a sua correlação com cada preditor, .YYYXtYXtYX^\mathrm{t}Y A solução de mínimos quadrados ordinários (OLS) é e não há um problema.β =(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y Mas suponha que seja quase singular (multicolinearidade) e você precise estimar o parâmetro ideal da crista. Todos os métodos …

2
O que são testes de chunk?
Em resposta a uma pergunta sobre seleção de modelos na presença de multicolinearidade , Frank Harrell sugeriu : Coloque todas as variáveis ​​no modelo, mas não teste o efeito de uma variável ajustada para os efeitos das variáveis ​​concorrentes ... Os testes de chunk de variáveis ​​concorrentes são poderosos porque …



3
Preciso descartar variáveis ​​correlacionadas / colineares antes de executar kmeans?
Estou executando kmeans para identificar grupos de clientes. Eu tenho aproximadamente 100 variáveis ​​para identificar clusters. Cada uma dessas variáveis ​​representa a% de gasto de um cliente em uma categoria. Portanto, se eu tiver 100 categorias, tenho essas 100 variáveis, de modo que a soma dessas variáveis ​​seja 100% para …

3
Como você pode lidar com estimativas instáveis ​​de
Estabilidade beta em regressão linear com alta multicolinearidade? Digamos que em uma regressão linear, as variáveis x1x1x_1 e x2x2x_2 têm alta multicolinearidade (a correlação é de cerca de 0,9). Estamos preocupados com a estabilidade do coeficiente ββ\beta , portanto temos que tratar a multicolinearidade. A solução do livro seria apenas …

1
Interpretando proporções que somam uma como variáveis ​​independentes em regressão linear
Eu estou familiarizado com o conceito de variáveis ​​categóricas e a respectiva codificação de variável fictícia que nos permite ajustar um nível como linha de base para evitar colinearidade. Também estou familiarizado com como interpretar estimativas de parâmetros a partir de tais modelos: a mudança prevista no resultado para um …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.