No contexto das ciências sociais de onde eu venho, a questão é se você está interessado em (a) previsão ou (b) testar uma questão de pesquisa focada. Se o objetivo é a previsão, as abordagens orientadas a dados são apropriadas. Se o objetivo é examinar uma questão de pesquisa focada, é importante considerar qual modelo de regressão testa especificamente sua pergunta.
Por exemplo, se sua tarefa era selecionar um conjunto de testes de seleção para prever o desempenho do trabalho, o objetivo pode, em certo sentido, ser visto como um de maximizar a previsão do desempenho do trabalho. Assim, abordagens orientadas a dados seriam úteis.
Por outro lado, se você quiser entender o papel relativo das variáveis de personalidade e variáveis de capacidade em influenciar o desempenho, uma abordagem específica de comparação de modelos pode ser mais apropriada.
Normalmente, ao explorar questões de pesquisa focadas, o objetivo é elucidar algo sobre os processos causais subjacentes que estão operando em oposição ao desenvolvimento de um modelo com previsão ideal.
Quando estou no processo de desenvolvimento de modelos sobre processos baseados em dados transversais, fico desconfiado: (a) incluindo preditores que teoricamente poderiam ser considerados conseqüências da variável de resultado. Por exemplo, a crença de uma pessoa de que ela é uma boa executora é um bom indicador do desempenho no trabalho, mas é provável que isso seja pelo menos parcialmente causado pelo fato de ter observado seu próprio desempenho. (b) incluindo um grande número de preditores que refletem os mesmos fenômenos subjacentes. Por exemplo, incluindo 20 itens, todos medindo a satisfação com a vida de maneiras diferentes.
Assim, as perguntas de pesquisa focadas dependem muito mais do conhecimento específico do domínio. Isso provavelmente explica de alguma maneira por que abordagens orientadas a dados são usadas com menos frequência nas ciências sociais.