A trindade dos testes com máxima probabilidade: o que fazer quando confrontados com conclusões contraditórias?


10

Os testes de Wald, Razão de Verossimilhança e Multiplicador de Lagrange no contexto da estimativa de máxima verossimilhança são assintoticamente equivalentes. No entanto, para amostras pequenas, elas tendem a divergir bastante e, em alguns casos, resultam em conclusões diferentes.

Como eles podem ser classificados de acordo com a probabilidade de rejeitar o nulo? O que fazer quando os testes têm respostas conflitantes? Você pode simplesmente escolher o que dá a resposta que deseja ou existe uma "regra" ou "orientação" sobre como proceder?


talvez seja apenas um caso em que as aproximações assintóticas das distribuições [nulas] de uma ou mais das três estatísticas de teste não sejam tão boas? talvez os resultados sejam diferentes porque os tamanhos reais dos testes são diferentes? qual é o tamanho da sua amostra?
Ronaf 20/09/10

Respostas:


5

Não conheço bem a literatura da área para oferecer uma resposta direta. No entanto, parece-me que, se os três testes diferirem, isso é uma indicação de que você precisa de mais pesquisas / coleta de dados para responder definitivamente à sua pergunta.

Você também pode querer procurar nesta pesquisa do Google Académico

Atualize em resposta ao seu comentário:

Se a coleta de dados adicionais não for possível, haverá uma solução alternativa. Faça uma simulação que espelhe sua estrutura de dados, tamanho da amostra e seu modelo proposto. Você pode definir os parâmetros para alguns valores pré-especificados. Estime o modelo usando os dados gerados e verifique qual dos três testes aponta para o modelo certo. Essa simulação ofereceria algumas orientações sobre qual teste usar para seus dados reais. Isso faz sentido?


11
Você está se referindo a um artigo específico? Eu imagino que eu poderia encontrar uma resposta para minha pergunta se eu pesquisasse, estudasse, lesse muito, mas 95% das perguntas que outras pessoas fazem aqui ... Além disso, em alguns casos, principalmente com dados macroeconômicos (que é minha área ), não há mais dados a serem coletados. Os dados são escassos (o número de observações, quero dizer), e você apenas precisa conviver com eles. Não existe uma solução para "obter mais dados". Eu esperava que alguém aqui conhecesse o tópico, mas não parece. Talvez uma vez que o site seja aberto ao público em geral?
Vivi

Suspeito que a resposta à sua pergunta seja específica do domínio / modelo e, portanto, não tenho certeza se posso recomendar um artigo específico.

11
Desculpe pelo atraso na resposta. Eu gosto da sua sugestão de simulação. Isso não é realmente fácil, no entanto. A verdade é que o que vejo na prática é que os pesquisadores apenas fazem o teste que é computacionalmente mais fácil ou que lhes dá o resultado desejado.
Vivi

8

Não darei uma resposta definitiva em termos de classificação dos três. Crie ICs de 95% em torno de seus parâmetros com base em cada um deles e, se eles forem radicalmente diferentes, seu primeiro passo deve ser aprofundar. Transforme seus dados (embora o LR seja invariável), regularize sua probabilidade, etc. Em um beliscão, eu provavelmente optaria pelo teste de LR e pelo IC associado. Um argumento aproximado segue.

O LR é invariável sob a opção de parametrização (por exemplo, T versus logit (T)). A estatística Wald assume a normalidade de (T - T0) / SE (T). Se isso falhar, seu IC está ruim. O bom do LR é que você não precisa encontrar uma transformação f (T) para satisfazer a normalidade. O IC 95% baseado em T será o mesmo. Além disso, se sua probabilidade não for quadrática, o IC de Wald 95%, que é simétrico, pode ser estranho, pois pode preferir valores com menor probabilidade do que aqueles com maior probabilidade.

Outra maneira de pensar sobre o LR é que ele está usando mais informações, em termos gerais, da função de probabilidade. O Wald é baseado no MLE e na curvatura da probabilidade em nulo. A pontuação é baseada na inclinação em nulo e na curvatura em nulo. O LR avalia a probabilidade sob o nulo e a probabilidade sob a união do nulo e da alternativa e combina os dois. Se você for forçado a escolher um, isso pode ser intuitivamente satisfatório para escolher o LR.

Lembre-se de que existem outros motivos, como conveniência ou computação, para optar pelo Wald ou Score. O Wald é o mais simples e, dado um parâmetro multivariado, se você estiver testando para definir muitos individuais como 0, existem maneiras convenientes de aproximar a probabilidade. Ou, se você deseja adicionar uma variável por vez a partir de algum conjunto, não convém maximizar a probabilidade de cada novo modelo, e a implementação dos testes de Pontuação oferece alguma conveniência aqui. O Wald e o Score se tornam atraentes à medida que seus modelos e probabilidade se tornam pouco atraentes. (Mas acho que não foi isso que você estava questionando, já que os três estão disponíveis ...)

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.