Perguntas com a marcação «multicollinearity»

Situação em que existe forte relação linear entre variáveis ​​preditoras, de modo que sua matriz de correlação se torna (quase) singular. Essa "condição ruim" dificulta a determinação do papel único de cada um dos preditores: surgem problemas de estimativa e aumentam os erros padrão. Preditores correlacionados bivariadamente muito altos são um exemplo de multicolinearidade.

9
Existe uma explicação intuitiva por que a multicolinearidade é um problema na regressão linear?
O wiki discute os problemas que surgem quando a multicolinearidade é um problema na regressão linear. O problema básico é que a multicolinearidade resulta em estimativas instáveis ​​de parâmetros, o que dificulta a avaliação do efeito de variáveis ​​independentes sobre variáveis ​​dependentes. Eu entendo as razões técnicas por trás dos …


1
Que correlação torna uma matriz singular e quais são as implicações da singularidade ou quase singularidade?
Estou fazendo alguns cálculos em diferentes matrizes (principalmente em regressão logística) e geralmente recebo o erro "Matrix is ​​singular", onde tenho que voltar e remover as variáveis ​​correlacionadas. Minha pergunta aqui é o que você consideraria uma matriz correlacionada "altamente"? Existe um valor limite de correlação para representar esta palavra? …


6
Por que a multicolinearidade não é verificada nas estatísticas modernas / aprendizado de máquina
Nas estatísticas tradicionais, durante a construção de um modelo, verificamos a multicolinearidade usando métodos como estimativas do fator de inflação de variância (VIF), mas no aprendizado de máquina, usamos a regularização para a seleção de recursos e não parecemos verificar se os recursos estão correlacionados em absoluto. Por que nós …

2
As variáveis ​​altamente correlacionadas na floresta aleatória não distorcem a precisão e a seleção de recursos?
No meu entendimento, variáveis ​​altamente correlacionadas não causarão problemas de multicolinearidade no modelo aleatório de floresta (por favor, corrija-me se estiver errado). No entanto, por outro lado, se eu tiver muitas variáveis ​​contendo informações semelhantes, o modelo pesará muito nesse conjunto e não nos outros? Por exemplo, existem dois conjuntos …

3
Qual fator de inflação de variação devo usar: ou ?
Estou tentando interpretar fatores de inflação de variância usando a viffunção no pacote de R car. A função imprime um generalizado e também . De acordo com o arquivo de ajuda , esse último valorVIFVIF\text{VIF}GVIF1 / ( 2 ⋅ df )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Para ajustar a dimensão do elipsóide de confiança, a …

3
Como lidar com a multicolinearidade ao realizar a seleção de variáveis?
Eu tenho um conjunto de dados com 9 variáveis ​​independentes contínuas. Estou tentando selecionar entre essas variáveis ​​para ajustar um modelo a uma única variável percentual (dependente) Score. Infelizmente, eu sei que haverá uma colinearidade séria entre várias das variáveis. Eu tentei usar a stepAIC()função em R para seleção de …


2
Diagnóstico de colinearidade problemático somente quando o termo de interação é incluído
Fiz uma regressão em condados dos EUA e estou verificando a colinearidade em minhas variáveis ​​'independentes'. O diagnóstico de regressão de Belsley, Kuh e Welsch sugere analisar as proporções de decomposição do índice de condições e da decomposição de variância: library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition Index …


2
O PCA é instável sob multicolinearidade?
Eu sei que em uma situação de regressão, se você tem um conjunto de variáveis ​​altamente correlacionadas, isso geralmente é "ruim" devido à instabilidade nos coeficientes estimados (a variação vai para o infinito, enquanto o determinante vai para zero). Minha pergunta é se essa "maldade" persiste em uma situação de …


1
Existe uma razão para preferir uma medida específica de multicolinearidade?
Ao trabalhar com muitas variáveis ​​de entrada, geralmente nos preocupamos com a multicolinearidade . Existem várias medidas de multicolinearidade que são usadas para detectar, pensar e / ou comunicar a multicolinearidade. Algumas recomendações comuns são: O múltiplo para uma variável específica R2jRj2R^2_j A tolerância, , para uma variável específica 1−R2j1−Rj21-R^2_j …

1
Como lidar com alta correlação entre preditores em regressão múltipla?
Encontrei uma referência em um artigo que é como: Segundo Tabachnick e Fidell (1996), as variáveis ​​independentes com correlação bivariada maior que 0,70 não devem ser incluídas na análise de regressão múltipla. Problema: usei em um projeto de regressão múltipla 3 variáveis ​​correlacionadas> 0,80, VIF em cerca de 0,2 - …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.