O contexto
(Nesta seção, apenas explicarei o teste de hipóteses, digite um e dois erros, etc., no meu próprio estilo. Se você se sentir confortável com esse material, pule para a próxima seção)
O lema de Neyman-Pearson surge no problema do simples teste de hipóteses . Temos duas distribuições de probabilidade diferentes em um espaço comum : e , denominadas hipóteses nula e alternativa. Com base em uma única observação , temos que adivinhar qual das duas distribuições de probabilidade está em vigor. Um teste é, portanto, uma função que para cada atribui uma suposição de "hipótese nula" ou "hipótese alternativa". Obviamente, um teste pode ser identificado com a região na qual ele retorna "alternativa"; portanto, estamos apenas procurando subconjuntos (eventos) do espaço de probabilidade.ΩP0 0P1ω ∈ Ωcoω
Normalmente, em aplicações, a hipótese nula corresponde a algum tipo de status quo, enquanto a hipótese alternativa é um fenômeno novo que você está tentando provar ou refutar é real. Por exemplo, você pode estar testando alguém quanto a poderes psíquicos. Você executa o teste padrão com os cartões com linhas onduladas ou não, e faz com que eles adivinhem um certo número de vezes. A hipótese nula é que eles não acertarão mais do que um em cada cinco (já que há cinco cartas), a hipótese alternativa é que eles são psíquicos e podem ficar mais certos.
O que gostaríamos de fazer é minimizar a probabilidade de cometer um erro. Infelizmente, essa é uma noção sem sentido. Existem duas maneiras de cometer um erro. A hipótese nula é verdadeira e você experimenta um na região "alternativa" do seu teste, ou a hipótese alternativa é verdadeira e você experimenta a região "nula". Agora, se você fixar uma região do espaço de probabilidade (um teste), os números eωUMAP0 0( A )P1( Ac), as probabilidades de cometer esses dois tipos de erros são completamente bem definidas, mas como você não tem noção prévia de "probabilidade de que a hipótese nula / alternativa seja verdadeira", não é possível obter uma "probabilidade significativa" de qualquer um dos tipos de erro". Portanto, essa é uma situação bastante típica em matemática, na qual queremos o "melhor" de alguma classe de objetos, mas quando você olha de perto, não há "melhor". Na verdade, o que estamos tentando fazer é minimizar e maximizar , que são objetivos claramente opostos.P0 0( A )P1( A )
Tendo em mente o exemplo do teste de habilidades psíquicas, gosto de me referir ao tipo de erro em que o nulo é verdadeiro, mas você conclui a alternativa tão verdadeira quanto a " ilusão " (você acredita que o psíquico do cara, mas ele não é) e o outro tipo de erro como " esquecimento ".
O Lema
A abordagem do lema de Neyman-Pearson é a seguinte: vamos escolher uma probabilidade máxima de ilusão que estamos dispostos a tolerar e, em seguida, encontrar o teste que tem uma probabilidade mínima de esquecimento e satisfaz esse limite superior. O resultado é que esses testes sempre têm a forma de um teste de razão de verossimilhança:α
Proposição (lema de Neyman-Pearson)
Se são as funções de probabilidade (PDFs) das hipóteses nulas e alternativas e , a região que maximiza enquanto mantém é de a formaeu0 0, L1α > 0A ⊆ ΩP1( A )P0 0( A ) ≤ α
A = { ω ∈ Ω ∣ L1( ω )eu0 0( ω )≥ K}
para alguma constante . Por outro lado, para qualquer , o teste acima tem para qualquer como .K> 0 KP1( A ) ≥ P1( B )BP0 0( B ) ≤ P0 0( A )
Assim, tudo o que precisamos fazer é encontrar a constante tal que .KP0 0( A ) = α
A prova na Wikipedia no momento da redação é uma prova matemática tipicamente oracular que consiste apenas em conjecturar essa forma e depois verificar se ela é realmente ótima. É claro que o verdadeiro mistério é de onde veio essa idéia de determinar a razão de probabilidade, e a resposta é: a taxa de probabilidade é simplesmente a densidade de em relação a .P1P0 0
Se você aprendeu a probabilidade por meio da abordagem moderna com integrais de Lebesgue e o que não, então sabe que, em condições razoavelmente irrestritas , sempre é possível expressar uma medida de probabilidade como sendo dada por uma função de densidade em relação a outra. Nas condições do lema de Neyman-Pearson, temos duas medidas de probabilidade , , ambas com densidades em relação a alguma medida subjacente, geralmente a medida de contagem em um espaço discreto ou a medida de Lebesgue em . Acontece que, como a quantidade que estamos interessados em controlar é , devemos tomar como nossa medida subjacente e visualizarP0 0P1RnP0 0( A )P0 0P1em termos de como ele se relaciona com , consideramos que é dado por uma função de densidade em relação a .P0 0P1P0 0
Compra de terrenos
O coração do lema é, portanto, o seguinte:
Let ser uma medida em algum espaço , e deixe ser positiva, função integrável em . Deixe . Então o conjunto com que maximiza tem a forma
para um constante e, inversamente, qualquer conjunto maximiza em todos os conjuntos menores que ele próprio na medida.μΩfΩα > 0UMAμ ( A ) ≤ α∫UMAfdμ{ ω ∈ Ω ∣ f( ω ) ≥ K}
K>0∫fB
Suponha que você esteja comprando terras. Você só pode pagar acres, mas há uma função de utilidade na terra, quantificando, digamos, o potencial para o cultivo e, portanto, você deseja uma região maximizando . A proposição acima diz que sua melhor aposta é ordenar basicamente o terreno do mais útil para o menos útil e comprá-lo da melhor para a pior até atingir a área máxima . Em testes de hipóteses, é , e representa a densidade de com respeito a (que, como já foi dito, é ).αf∫fαμP0fP1P0L1/L0
Aqui está uma rápida prova heurística: de uma determinada região de terra , considere uma pequena um metro por um metro quadrado telha, . Se você puder encontrar outro bloco da mesma área em algum lugar fora de , mas de modo que a utilidade de seja maior que a de , então claramente não é ideal, pois pode ser melhorado trocando por . Assim, uma região óptima deve ser "fechada para cima", ou seja, se e , então tem de ser em , caso contrário, poderia fazer melhor trocandoABB′AB′BABB′x∈Af(y)>f(x)yAxe . Isto é equivalente a dizer que é simplesmente para alguns .yAf−1([K,+∞))K