É verdade que as suposições da regressão linear não são realistas. No entanto, isso é verdade para todos os modelos estatísticos. "Todos os modelos estão errados, mas alguns são úteis."
Eu acho que você tem a impressão de que não há razão para usar a regressão linear quando você pode usar um modelo mais complexo. Isso não é verdade, porque, em geral, modelos mais complexos são mais vulneráveis à adaptação excessiva e usam mais recursos computacionais, o que é importante se, por exemplo, você estiver tentando fazer estatísticas em um processador incorporado ou em um servidor da web. Modelos mais simples também são mais fáceis de entender e interpretar; por outro lado, modelos complexos de aprendizado de máquina, como redes neurais, tendem a acabar como caixas-pretas, mais ou menos.
Mesmo que a regressão linear um dia se torne praticamente útil (o que parece extremamente improvável no futuro próximo), ela ainda será teoricamente importante, porque modelos mais complexos tendem a se basear na regressão linear. Por exemplo, para entender uma regressão logística regular de efeitos mistos, você precisa entender primeiro a regressão linear simples e antiga.
Isso não quer dizer que modelos mais complexos, mais novos e mais brilhantes não sejam úteis ou importantes. Muitos deles são. Mas os modelos mais simples são mais amplamente aplicáveis e, portanto, mais importantes, e claramente fazem sentido apresentar primeiro se você vai apresentar uma variedade de modelos. Atualmente, existem muitas análises de dados ruins conduzidas por pessoas que se autodenominam "cientistas de dados" ou algo assim, mas nem mesmo sabem o que é fundamental, como o que realmente é um intervalo de confiança. Não seja uma estatística!