Agora, entendo que isso depende de distribuições e normalidade nos preditores
a transformação de log torna os dados mais uniformes
Como afirmação geral, isso é falso - mas, mesmo que fosse o caso, por que a uniformidade seria importante?
Considere, por exemplo,
i) um preditor binário que aceita apenas os valores 1 e 2. A obtenção de logs o deixaria como um preditor binário que aceita apenas os valores 0 e log 2. Realmente não afeta nada, exceto a interceptação e a escala de termos que envolvem esse preditor. Mesmo o valor p do preditor permaneceria inalterado, assim como os valores ajustados.
ii) considere um preditor de inclinação para a esquerda. Agora pegue os logs. Normalmente fica mais inclinado para a esquerda.
iii) dados uniformes ficam inclinados para a esquerda
(muitas vezes nem sempre é uma mudança tão extrema)
menos afetado por outliers
Como uma afirmação geral, isso é falso. Considere valores discrepantes baixos em um preditor.
Pensei em log transformando todas as minhas variáveis contínuas que não são de interesse principal
Para quê? Se originalmente os relacionamentos fossem lineares, não seriam mais.
E se eles já estavam curvados, fazer isso automaticamente pode torná-los piores (mais curvos), não melhores.
-
Tomar registros de um preditor (de interesse primário ou não) pode às vezes ser adequado, mas nem sempre é assim.