Diferenças entre um modelo estatístico e um modelo de probabilidade?

A probabilidade aplicada é um ramo importante da probabilidade, incluindo a probabilidade computacional. Como a estatística está usando a teoria das probabilidades para construir modelos para lidar com dados, como eu entendo, estou me perguntando qual é a diferença essencial entre o modelo estatístico e o modelo de probabilidade? O modelo de probabilidade não precisa de dados reais? Obrigado.

probability mathematical-statistics

— Honglang Wang
fonte

Um Modelo de Probabilidade consiste no trigêmeo , onde é o espaço da amostra, é uma álgebra (eventos) e é uma medida de probabilidade em $(\Omega,{\mathcal F},{\mathbb P})$ $\Omega$ ${\mathcal F}$ $\sigma$ ${\mathbb P}$ ${\mathcal F}$ .

Explicação intuitiva . Um modelo de probabilidade pode ser interpretado como um conhecido variável aleatória . Por exemplo, seja uma variável aleatória distribuída normalmente com média e variação . Nesse caso, a medida de probabilidade está associada à Função de Distribuição Cumulativa (CDF) através $X$ $X$ $0$ $1$ ${\mathbb P}$ $F$

F (x) = P (X \leq x) = P (ω \in Ω : X (ω) \leq x) = \int_{- \infty}^{x} \frac{1}{\sqrt{2 π}} \exp (- \frac{t^{2}}{2}) d t .

$F(x)={\mathbb P}(X\leq x) = {\mathbb P}(\omega\in\Omega:X(\omega)\leq x) =\int_{-\infty}^x \dfrac{1}{\sqrt{2\pi}}\exp\left({-\dfrac{t^2}{2}}\right)dt.$

Generalizações . A definição do Modelo de Probabilidade depende da definição matemática de probabilidade; veja, por exemplo, Probabilidade Livre e Probabilidade quântica .

Um modelo estatístico é um conjunto ${\mathcal S}$ de modelos de probabilidade, ou seja, um conjunto de medidas / distribuições de probabilidade no espaço amostral . $\Omega$

Esse conjunto de distribuições de probabilidade é geralmente selecionado para modelar um determinado fenômeno do qual temos dados.

Explicação intuitiva . Em um modelo estatístico, os parâmetros e a distribuição que descrevem um determinado fenômeno são desconhecidos. Um exemplo disto é a familia de distribuição normal com média e variância , isto é, ambos os parâmetros não são conhecidos e se habitualmente pretende utilizar o conjunto de dados para estimar os parâmetros (por exemplo, seleccionando um elemento de ) Esse conjunto de distribuições pode ser escolhido em qualquer e , mas, se não me engano, em um exemplo real, apenas aqueles definidos no mesmo par $\mu\in{\mathbb R}$ $\sigma^2\in{\mathbb R_+}$ ${\mathcal S}$ $\Omega$ ${\mathcal F}$ $(\Omega,{\mathcal F})$ são razoáveis para considerar.

Generalizações . Este artigo fornece uma definição muito formal de Modelo Estatístico, mas o autor menciona que "o modelo bayesiano requer um componente adicional na forma de uma distribuição anterior ... Embora as formulações bayesianas não sejam o foco principal deste artigo". Portanto, a definição de modelo estatístico depende do tipo de modelo que usamos: paramétrico ou não paramétrico. Também no cenário paramétrico, a definição depende de como os parâmetros são tratados (por exemplo, Clássico vs. Bayesiano).

A diferença é: em um modelo de probabilidade, você sabe exatamente a medida de probabilidade, por exemplo, , onde são parâmetros conhecidos., Enquanto em um modelo estatístico, você considera conjuntos de distribuições , por exemplo , em que são parâmetros desconhecidos. $\mbox{Normal}(\mu_0,\sigma_0^2)$ $\mu_0,\sigma_0^2$ $\mbox{Normal}(\mu,\sigma^2)$ $\mu,\sigma^2$

Nenhum deles requer um conjunto de dados, mas eu diria que um modelo estatístico geralmente é selecionado para modelar um.

— Xi'an
fonte

@ HonglangWang Isso está correto até certo ponto. A principal diferença é que um modelo de probabilidade é apenas uma distribuição (conhecida), enquanto um modelo estatístico é um conjunto de modelos de probabilidade; os dados são usados para selecionar um modelo desse conjunto ou um subconjunto menor de modelos que melhor (em certo sentido) descrevam o fenômeno (à luz dos dados).

Ω \times Θ

$\Omega \times \Theta$

P

${\mathbb P}$ is indeed defined through the CDF. Now, the interpretation of

Ω

$\Omega$ is the difficult one because, formally,

P (X \leq x)

${\mathbb P}(X\leq x)$ means

P (ω \in Ω : X (ω) \leq x)

${\mathbb P}(\omega\in\Omega: X(\omega)\leq x)$ , then

Ω

$\Omega$ are not observable values.

F

${\mathcal F}$ is a

σ -

$\sigma-$ algebra which is the pre-image of the Borel

σ -

$\sigma-$ algebra under

X

$X$ , again this are not observable. I am not sure how to explain this in an intuitive level.

@gung

Ω

$\Omega$ depends on the application; it is not determined by theory. For instance,

Ω

$\Omega$ could be a set of Brownian motions describing the price of a financial derivative and

X

$X$ could be the value attained at a fixed time

t

$t$ . In another application

Ω

$\Omega$ could be a set of people and

X

$X$ could be the lengths of their forearms. Generally,

Ω

$\Omega$ is a mathematical model of the physical objects of study and

X

$X$ is a numerical property of those objects.

F

$\mathcal{F}$ is the set of possible events: those situations to which we want to ascribe probabilities.

— whuber

@gung

F

$\mathcal{F}$ is a sigma algebra: it's a collection of subsets (the "events"). In the financial application, it's a set of price histories; in the forearm measurements application, the events would be sets of people. We can talk about this more if you want in a chat room.

— whuber