Probabilidade
Problemas comuns na teoria da probabilidade referem-se à probabilidade das observações dado um determinado modelo e dados aos parâmetros (vamos chamá-los ) envolvidos. Por exemplo, as probabilidades de situações específicas em jogos de cartas ou dados são muitas vezes muito diretas.x1 1, x2, . . . , xnθ
No entanto, em muitas situações práticas, estamos lidando com uma situação inversa ( estatística inferencial ). Ou seja: a observação é fornecida e agora o modelo é desconhecido , ou pelo menos não conhecemos certos parâmetros .x1 1, x2, . . . , xk θθ
Nesse tipo de problema, geralmente nos referimos a um termo chamado probabilidade dos parâmetros , que é uma taxa de crença em um parâmetro específico com as observações . Este termo é expresso como proporcional à probabilidade das observações assumindo que um parâmetro de modelo seria hipoteticamente verdadeiro. L ( θ )θx1 1, x2, . . xkx1 1, x2, . . xkθL (θ, x1 1, x2, . . xk) Α observações probabilidade x1 1, x2, . . xk dado θ
Para um dado valor de parâmetro mais provável é uma determinada observação é (relativa à probabilidade com outros valores de parâmetro), mais a observação suporta esse parâmetro específico (ou teoria / hipótese que assume esse parâmetro) . Uma probabilidade (relativa) alta reforçará nossas crenças sobre esse valor de parâmetro (há muito mais filosófico a dizer sobre isso).θx1 1, x2, . . xn
Probabilidade no problema do tanque alemão
Agora, para o problema do tanque alemão, a função de probabilidade para um conjunto de amostras é:x1 1, x2, . . xk
L (θ, x1 1, x2, . . xk) = Pr ( x1 1, x2, . . xk, θ ) = { 0( θk)- 1se max ( x1 1, x2, . . xk) > θse max ( x1 1, x2, . . xk) ≤ θ ,
Se você observa amostras {1, 2, 10} ou amostras {8, 9, 10} não deve importar quando as amostras são consideradas de uma distribuição uniforme com o parâmetro . Ambas as amostras são igualmente prováveis com probabilidade e, usando a idéia de probabilidade, uma amostra não conta mais sobre o parâmetro que a outra amostra.θ( θ3)- 1θ
Os altos valores {8, 9, 10} podem fazer você pensar / acreditar que deve ser maior. Porém, é apenas o valor {10} que realmente fornece informações relevantes sobre a probabilidade de (o valor 10 indica que será dez ou mais alto, os outros valores 8 e 9 não contribuem com nada para essas informações )θθ θθθ
Teorema de fatoração de Fisher Neyman
Este teorema diz que uma certa estatística (ou seja, alguma função das observações, como média, mediana ou, no máximo, no problema do tanque alemão) é suficiente (contém todas as informações) quando você pode fatorar, na função de probabilidade, os termos que dependem das outras observações , de modo que esse fator não dependa dos parâmetros e (e a parte da função de probabilidade que relaciona os dados com os valores hipotéticos dos parâmetros depende apenas da estatística, mas não de todo o dado / observação).T( x1 1, x2, … , Xk)x1 1, x2, … , Xkθx1 1, x2, … , Xk
O caso do problema do tanque alemão é simples. Você pode ver acima que a expressão inteira para a Probabilidade acima já depende apenas da estatística e o restante dos valores não importa.max ( x1 1, x2, . . xk)x1 1, x2, . . xk
Joguinho como exemplo
Digamos que jogamos repetidamente o seguinte jogo: é uma variável aleatória e é desenhada com probabilidade igual 100 ou 110. Em seguida, desenhamos uma amostra .θx1 1, x2, . . . , xk
Queremos escolher uma estratégia para adivinhar , com base nos que maximizem nossa probabilidade de ter o palpite correto de .θx1 1, x2, . . . , xkθ
A estratégia adequada será escolher 100, a menos que um dos números da amostra seja> 100.
Poderíamos ser tentados a escolher o valor do parâmetro 110 já que muitos dos tendem a ser todos os valores altos próximos de cem (mas nenhum exatamente acima de cem), mas isso seria errado. A probabilidade de tal observação será maior quando o valor verdadeiro do parâmetro for 100 do que quando for 110. Portanto, se adivinharmos, nessa situação, 100 como o valor do parâmetro, teremos menos probabilidade de cometer um erro (porque o A situação com esses valores altos próximos de cem, mas ainda abaixo dele, ocorre com mais frequência no caso em que o valor verdadeiro é 100 e não no caso em que o valor verdadeiro é 110).x1 1, x2, . . . , xk