Imagine, você é um médico em uma unidade de terapia intensiva. Você tem um paciente com febre forte e um determinado número de células sanguíneas, um determinado peso corporal e uma centena de dados diferentes e deseja prever se ele sobreviverá. Se sim, ele ocultará a história do outro filho para a esposa; caso contrário, é importante que ele a revele, enquanto pode.
O médico pode fazer essa previsão com base nos dados de ex-pacientes que ele teve em sua unidade. Com base no seu conhecimento de software, ele pode prever usando uma regressão linear generalizada (glm) ou através de uma rede neural (nn).
1. Modelo Linear Generalizado
Existem muitos parâmetros correlatos para o glm. Para chegar a um resultado, o médico terá que fazer suposições (linearidade etc.) e decisões sobre quais parâmetros provavelmente terão influência. O glm o recompensará com um teste t de significância para cada um de seus parâmetros, para que ele possa reunir fortes evidências de que gênero e febre têm uma influência significativa, o peso corporal não necessariamente.
2. Rede neural
A rede neural engolirá e digerirá todas as informações existentes na amostra de ex-pacientes. Não interessa se os preditores estão correlacionados e não revelará tanta informação, se a influência do peso corporal parece ser importante apenas na amostra em questão ou em geral (pelo menos não no nível de especialização que o médico tem a oferecer). Apenas calculará um resultado.
O que é melhor
Qual método escolher depende do ângulo em que você olha para o problema: Como paciente, eu preferiria a rede neural que usa todos os dados disponíveis para uma melhor estimativa do que acontecerá comigo sem suposições fortes e obviamente erradas, como linearidade. Como médico, que deseja apresentar alguns dados em um diário, ele precisa de valores-p. A medicina é muito conservadora: eles vão pedir valores-p. Então, o médico quer relatar que, em tal situação, o gênero tem uma influência significativa. Para o paciente, isso não importa, basta usar qualquer influência que a amostra sugira ser mais provável.
Neste exemplo, o paciente deseja previsão, o lado do cientista do médico deseja inferência. Principalmente, quando você quer entender um sistema, a inferência é boa. Se você precisar tomar uma decisão em que não possa entender o sistema, a previsão terá que ser suficiente.