Em um conjunto de dados de duas populações não sobrepostas (pacientes e saudáveis, total ), gostaria de encontrar (de variáveis independentes) preditores significativos para uma variável dependente contínua. Correlação entre preditores está presente. Estou interessado em descobrir se algum dos preditores está relacionado à variável dependente "na realidade" (em vez de prever a variável dependente da maneira mais exata possível). Como fiquei impressionado com as inúmeras abordagens possíveis, gostaria de perguntar qual é a abordagem mais recomendada.300
Pelo meu entendimento, a inclusão ou exclusão gradual de preditores não é recomendada
Por exemplo, execute uma regressão linear separadamente para cada preditor e corrija os valores de p para comparação múltipla usando FDR (provavelmente muito conservador?)
Regressão de componente principal: difícil de interpretar, pois não poderei falar sobre o poder preditivo de preditores individuais, mas apenas sobre os componentes.
alguma outra sugestão?