Vou dar uma olhada nisso, embora eu não seja um estatístico, de maneira alguma, mas acabo fazendo muitas 'modelagens' - estatísticas e não estatísticas.
Primeiro vamos começar com o básico:
O que é exatamente um modelo?
Um modelo é uma representação da realidade, embora altamente simplificada. Pense em um modelo de cera / madeira para uma casa. Você pode tocar / sentir / cheirar. Agora, um modelo matemático é uma representação da realidade usando números.
O que é essa "realidade" que ouço você perguntar? OK. Então pense nesta situação simples: o governador do seu estado implementa uma política dizendo que o preço de um maço de cigarros agora custaria US $ 100 para o próximo ano. O "objetivo" é impedir que as pessoas comprem cigarros, diminuindo assim o fumo, tornando os fumantes mais saudáveis (porque eles pararam).
Depois de um ano, o governador pergunta: isso foi um sucesso? Como você pode dizer aquilo? Bem, você captura dados como número de pacotes vendidos / dia ou por ano, respostas de pesquisas, quaisquer dados mensuráveis que você possa colocar em mãos que sejam relevantes para o problema. Você acabou de começar a 'modelar' o problema. Agora você deseja analisar o que esse 'modelo' diz . É aí que a modelagem estatística é útil. Você pode executar um gráfico de correlação / dispersão simples para ver como o modelo 'se parece'. Você pode ter vontade de determinar a causalidade, por exemplo, se o aumento do preço levar à diminuição do fumo ou se houver outros fatores de confusão em jogo (por exemplo, talvez seja outra coisa completamente diferente e seu modelo tenha sentido alguma falta?).
Agora, a construção desse modelo é feita por um 'conjunto de regras' (mais como diretrizes), isto é, o que é / não é legal ou o que faz / não faz sentido. Você deve saber o que está fazendo e como interpretar os resultados deste modelo. Construir / Executar / Interpretar este modelo requer conhecimentos básicos de estatística. No exemplo acima, você precisa saber sobre gráficos de correlação / dispersão, regressão (uni e multivariada) e outras coisas. Sugiro a leitura intuitiva da leitura divertida / informativa sobre a compreensão intuitiva de estatísticas: o que é um valor-p de qualquer maneira É uma introdução bem-humorada à estatística e ensinará a 'modelar' ao longo do caminho, do simples ao avançado (ou seja, regressão linear). Então você pode continuar e ler outras coisas.
Portanto, lembre-se de que um modelo é uma representação da realidade e que "todos os modelos estão errados, mas alguns são mais úteis que outros" . Um modelo é uma representação simplificada da realidade e você não pode considerar tudo, mas deve saber o que fazer e o que não deve considerar como um bom modelo que pode fornecer resultados significativos.
Não para por aqui. Você pode criar modelos para simular a realidade também! É assim que muitos números mudam ao longo do tempo (digamos). Esses números são mapeados para uma interpretação significativa em seu domínio. Você também pode criar esses modelos para extrair seus dados para ver como as várias medidas se relacionam (a aplicação das estatísticas aqui pode ser questionável, mas não se preocupe por enquanto). Exemplo: você analisa as vendas de supermercado de uma loja por mês e percebe que sempre que a cerveja é comprada, há um pacote de fraldas (você cria um modelo que percorre o conjunto de dados e mostra essa associação). Pode ser estranho, mas pode significar que a maioria dos pais compra isso no fim de semana quando o bebê está sentado com os filhos? Coloque fraldas perto de cervejas e você poderá aumentar suas vendas! Aaah! Modelagem :)
Estes são apenas exemplos e de modo algum uma referência para o trabalho profissional. Basicamente, você constrói modelos para entender / estimar como a realidade funcionará / e para tomar melhores decisões com base nos resultados. Estatística ou não, você provavelmente está modelando toda a sua vida sem perceber. Boa sorte :)