Como o poder de uma regressão logística e de um teste t se compara?

O poder de uma regressão logística e de um teste t é equivalente? Nesse caso, eles devem ser "equivalentes à densidade de dados", pelo que quero dizer que o mesmo número de observações subjacentes produz o mesmo poder, dado um alfa fixo de 0,05. Considere dois casos:

[Teste t paramétrico]: são feitos 30 desenhos de uma observação binomial e os valores resultantes são calculados como média. Isso é feito 30 vezes para o grupo A (que tem um Pr binomial de 0,70 de ocorrência) e 30 vezes para o grupo B (que tem um Pr binomial de 0,75 de ocorrência). Isso gera 30 médias por grupo que representam um resumo de 1.800 empates de uma distribuição binomial. Um teste t de 58df é realizado para comparar as médias.
[A regressão logística]: Uma regressão logística é executada com uma inclinação codificada simulada que representa a participação no grupo e cada um dos 1.800 sorteios.

Minha pergunta tem duas partes:

Dado um conjunto alfa de 0,05, o poder dessas metodologias será o mesmo ou diferente? Por quê? Como posso provar isso?
A resposta à pergunta 1 é sensível aos tamanhos das amostras que entram no teste t, ao tamanho da amostra de cada grupo no teste t, às probabilidades binomiais subjacentes ou a algum outro fator? Se sim, como posso saber (sem simulação) que o poder é realmente diferente e que tipo de mudanças produzirá que tipo de mudanças no poder? Como alternativa, forneça o código R elaborado que resolve o problema usando a simulação.

— russellpierce
fonte

Respostas:

Se calculei corretamente, a regressão logística assintoticamente tem o mesmo poder que o teste t. Para ver isso, anote sua probabilidade logarítmica e calcule a expectativa de seu Hessian no seu máximo global (suas estimativas negativas são a matriz de variância-covariância da solução ML). Não se preocupe com a parametrização logística usual: é mais simples parametrizar com as duas probabilidades em questão. Os detalhes dependerão exatamente de como você testa a importância de um coeficiente de regressão logística (existem vários métodos).

O fato de esses testes terem poderes semelhantes não deve ser muito surpreendente, porque a teoria do qui-quadrado para estimativas de ML é baseada em uma aproximação normal da probabilidade logarítmica, e o teste t é baseado em uma aproximação normal das distribuições de proporções. O cerne da questão é que ambos os métodos fazem as mesmas estimativas das duas proporções e ambas as estimativas têm os mesmos erros padrão.

Uma análise real pode ser mais convincente. Vamos adotar uma terminologia geral para os valores em um determinado grupo (A ou B):

é a probabilidade de um 1. $p$
é o tamanho de cada conjunto de empates. $n$
é o número de conjuntos de empates. $m$
é a quantidade de dados. $N = m n$
(igual a ou ) é o valor do resultado no conjunto de empates. $k_{ij}$ $0$ $1$ $j^\text{th}$ $i^\text{th}$
é o número total de unidades no conjunto de empates. $k_i$ $i^\text{th}$
é o número total de unidades. $k$

A regressão logística é essencialmente o estimador de ML de . Seu logaritmo é dado por $p$

\log (L) = k \log (p) + (N - k) \log (1 - p) .

$\log(\mathbb{L}) = k \log(p) + (N-k) \log(1-p).$

Suas derivadas em relação ao parâmetro são $p$

\frac{\partial \log (L)}{\partial p} = \frac{k}{p} - \frac{N - k}{1 - p} and

$\frac{\partial \log(\mathbb{L})}{ \partial p} = \frac{k}{p} - \frac{N-k}{1-p} \text{ and}$

- \frac{\partial^{2} \log (L)}{\partial p^{2}} = \frac{k}{p^{2}} + \frac{N - k}{(1 - p)^{2}} .

$-\frac{\partial^2 \log(\mathbb{L})}{\partial p^2} = \frac{k}{p^2} + \frac{N-k}{(1-p)^2}.$

Configurando os rendimentos primeiro a zero o ML estimativa e entupimento em que o recroco da segunda expressão produz a variância , que é o quadrado do erro padrão. ${\hat{p} = k/N}$ $\hat{p}(1 - \hat{p})/N$

A estatística t será obtida dos estimadores com base nos dados agrupados por conjuntos de sorteios; ou seja, como a diferença das médias (uma do grupo A e outra do grupo B) dividida pelo erro padrão dessa diferença, que é obtido a partir dos desvios padrão das médias. Vamos examinar a média e o desvio padrão para um determinado grupo, então. As médias iguais , que é idêntico ao ML estimador . O desvio padrão em questão é o desvio padrão dos meios de tração; isto é, é o desvio padrão do conjunto de . Aqui está o cerne da questão, então vamos explorar algumas possibilidades. $k/N$ $\hat{p}$ $k_i/n$

$n = 1$ $m = N$ $k_{i}$ $N/(N-1)$ $\hat{p}(1 - \hat{p})$ $\sqrt{N/(N-1)}$ $1$ $N = 1800$
$k_i/n$ $p(1-p)/n$ $k_i$ $n$ $p$ $p(1-p)$ $m$ $p(1-p)/n/m = p(1-p)/N$

$m$ $n$ $m n = N$

$p = 0.70$ $p = 0.74$ $m = 900, n = 1$ $m = n = 30$ $m = 2, n = 450$ $\alpha = 0.05$ $p = 0.50$ $p = 0.52$

A moral dessa análise é:

$N$ $m$
$m$ $n$
$N$

— whuber
fonte

@suncoolsu É uma pena que não podemos votar a atualização ...

— chl

@chl .. Eu concordo, eu gostaria de dar (+2) :-), na verdade eu nunca pensei tão profundamente sobre esta questão até esta atualização.

— suncoolsu

Como sempre, um tour de force de Bill Huber. Examino a questão intrigada sobre como comparar a potência do teste t com uma regressão logística. Mas parece que a semelhança é colocar ambos os métodos para a tarefa de testar proporções ..

— Michael R. Chernick

Aqui está o código em R que ilustra a simulação da resposta do whuber . Comentários sobre como melhorar meu código R são bem-vindos.

N <- 900            # Total number data points
m <- 30;            # Size of draw per set
n <- 30;            # No of sets

p_null <- 0.70;     # Null hypothesis
p_alternate <- 0.74 # Alternate hypothesis
tot_iter <- 10000;

set.seed(1);        # Initialize random seed
null_rejected <- 0; # Set counter to 0
for (iter in 1:tot_iter)
{
    draws1 <- matrix(0,m,n);
    draws2 <- matrix(0,m,n);
    means1 <- matrix(0,m);
    means2 <- matrix(0,m);

    for (obs in 1:m)
    {
        draws1[obs,] <- rbinom(n,1,p_null);
        draws2[obs,] <- rbinom(n,1,p_alternate);

        means1[obs,] <- mean(draws1[obs,]);
        means2[obs,] <- mean(draws2[obs,]);
    }
    if (t.test(means1,means2,alternative="l")$p.value <= 0.05)
    {
        null_rejected <- null_rejected + 1; 
    }
}
power <- null_rejected / tot_iter

— Comunidade
fonte

Obrigado por compartilhar isso! (. Gosto do seu estilo de fazer todas as variáveis parâmetros e claramente comentando-los) Eu estou sem votos hoje :-( então eu vou ter que esperar para upvote-lo.

— whuber

replicate()rbinom()

k

$k$ {*}apply()

@chl Obrigado. Estou usando essas perguntas para aprender o R! Portanto, comentários como o seu são valiosos.

@Skrikant LOL Acabei de adicionar: "BTW, eu gosto do jeito que você aprende R!"

— chl

Estou confuso; isso não dá apenas o poder do teste?

— russellpierce