Teoria por trás do teste se


7

Suponha que , onde seja conhecido. Usando esses dados, desejamos testar se , isto é, se a média é um número racional.Xii.i.d.N(μ,σ2)σ2μQμ

Parece intuitivamente claro que não podemos fazer isso, pois qualquer ruído será muito intenso. Eu imagino que qualquer teste terá taxa de erro tipo II e taxa de erro tipo I ou vice-versa. Mas não entendo como fazer afirmações teóricas sobre esse problema de teste de hipóteses. Como esse problema se encaixa em uma estrutura mais geral que ilustra quando o teste é "difícil"?β=0α=1

Respostas:


7

Sua intuição está correta: quando você tiver um conjunto nulo para a média densa em relação ao espaço total, não poderá diferenciar os conjuntos nulo e alternativo com dados contínuos. Isso ocorre porque, para qualquer valor médio na hipótese alternativa, sempre podemos obter um que seja "arbitrariamente próximo" no conjunto nulo. Portanto, nunca deve haver nenhuma evidência para a hipótese alternativa.

Para obter uma demonstração formal desse resultado, você precisa passar pelos movimentos de construir isso como um teste de hipótese composto. Isso é um pouco complicado, já que você precisa argumentar sobre algumas estatísticas de teste e existem algumas objeções plausíveis aqui.


Construção formal do teste clássico de hipóteses: Para este teste, as hipóteses são:

H0:μQ,HA:μQ.

O primeiro problema que você encontra é a construção de uma estatística de teste. A estatística da razão de verossimilhança (LR) para esse problema é sempre igual a um, pois os racionais são densos nos reais. Nós temos:

supμQsupσ>0i=1nN(xi|μ,σ2)=(n2πxi2)n/2exp(n2)=supμQsupσ>0i=1nN(xi|μ,σ2),

de modo que a proporção desses supremos é a unidade. Isso significa que a estatística LR padrão falha em servir como uma medida de evidência para as hipóteses e, portanto, precisamos de uma estatística de teste personalizada.

Agora, para essas hipóteses, a classificação ordinal da evidência cai em apenas duas categorias: se a média da amostra é racional (o que ocorre com probabilidade zero), essa é uma evidência maior para a hipótese nula; se a média da amostra é irracional (o que ocorre com probabilidade 1), essa é uma evidência maior para a hipótese alternativa. Portanto, a estatística de teste apropriada para o teste é , com valores mais altos deste estatística do teste (indicador) que constitui maior evidência para a alternativa.TT(X1,...,Xn)I(X¯Q)

Como é contínuo, temos em todos os valores de parâmetro (isso decorre do fato de os racionais terem Lebesgue medir zero ). Isso significa que a estatística de teste tem a mesma distribuição, independentemente dos valores dos parâmetros.X¯N(μ,σ2/n)P(T=0|μ,σ)=P(X¯Q|μ,σ)=0

Se observarmos (ou seja, a média da amostra é irracional), o valor de p para o teste é:x¯Q

pP(T(X¯)t(x¯)|H0)=P(T1|μQ)=1.

Se observarmos (ou seja, a média da amostra é racional), o valor p para o teste é:x¯Q

pP(T(X¯)t(x¯)|H0)=P(T0|μQ)=1.

Portanto, vemos que, mesmo com uma estatística de teste personalizada que tenta diferenciar as hipóteses, nunca obtemos nenhuma evidência contra o nulo. Isso é intuitivamente razoável, pois para qualquer valor médio na hipótese alternativa, sempre podemos obter um que seja "arbitrariamente próximo" no conjunto nulo.


2
É claro que tudo aqui está correto (+1) - mas eu gostaria de sugerir o foco na topologia dos racionais e dos reais, e sua medida de Lebesgue, perde um pouco um ponto mais fundamental (que você faz, mas talvez não enfatize) tanto quanto você pode). Se, por exemplo , o modelo fosse o conjunto de distribuições normais com parâmetros que para e caso contrário, você pode testarO significado mais fundamental de "denso" está na topologia do modelo determinado pelas razões de probabilidade de log. (μ,σ2(μ))σ(μ)=1μQσ(μ)=2H0:μQ.
whuber

2
Bom ponto - minha própria discussão se limitou apenas ao caso específico em questão, mas certamente seria interessante estender isso a uma discussão mais ampla para esses casos mais amplos.
Ben - Restabelece Monica
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.