Relatar resultados de uma regressão logística


13

Eu tenho a seguinte saída de regressão logística:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

É apropriado relatar isso da seguinte maneira:

Coeficiente beta, Odds ratio, Zvalue, valor de P. Em caso afirmativo, como posso obter a razão de chances?


Respostas:


9

Seu relatório sugerido para uma tabela parece razoável, embora os valores z e p sejam redundantes. Muitos diários com os quais estou familiarizado não relatam o valor-z / valor-p e usam apenas asteriscos para relatar significância estatística. Também vi tabelas logísticas apenas com as taxas de ímpares relatadas, embora eu pessoalmente prefira as probabilidades de log e as taxas de probabilidades relatadas se o espaço permitir em uma tabela.

Porém, locais diferentes podem ter guias diferentes quanto aos procedimentos de relatório, portanto, o que é esperado pode variar. Se estou enviando um artigo para um diário, frequentemente verei como outros trabalhos recentes fizeram suas tabelas e apenas os imitamos. Se for seu trabalho pessoal, perguntar a quem quer que esteja analisando seria uma solicitação razoável. Como mencionei acima, as restrições de espaço em alguns locais podem impedir que você relate informações redundantes (como as probabilidades de log e as razões de chances). Alguns lugares podem forçá-lo a relatar os resultados inteiramente em texto!

Há também a questão de quais outros modelos de resumo devem ser relatados. Embora muitas revistas Estou familiarizado com frequência relatório pseudo valores, aqui é uma discussão sobre o site que discute as fraquezas de várias medidas. Eu pessoalmente prefiro as taxas de classificação a serem relatados, mas novamente eu suspeito que isso varia de acordo com local (eu posso imaginar algumas revistas iria pedir especificamente para um dos pseudo R 2 medidas a ser relatado).R2R2

Para chegar proporção do estranho apenas exponentiate o coeficiente de regressão (ou seja, tomar , onde e é a base do logaritmo natural e β é o coeficiente de regressão logística estimado.) Um bom palpite em qualquer linguagem estatística para calcular isso é .eβ^eβ^exp(coefficient)

Também como nota, embora esta seja a resposta atualmente aceita, lejohn e Frank Harrell dão conselhos muito úteis. Embora eu normalmente sempre deseje que as estatísticas da pergunta sejam relatadas em algum lugar, as outras respostas, conselhos sobre outras medidas, são maneiras úteis de avaliar o tamanho dos efeitos em relação a outros efeitos estimados no modelo. Os procedimentos gráficos também são úteis para examinar os tamanhos dos efeitos relativos e ver esses dois trabalhos sobre como transformar tabelas em gráficos como exemplos ( Kastellec & Leoni, 2007 ; Gelman et al., 2002 )


O link Kastellec & Leoni, 2007 está quebrado, mas aqui está um exemplo do mesmo artigo com código.
ACNB

11

A resposta a esta pergunta pode depender de sua formação disciplinar.

Aqui estão algumas considerações gerais.

Os beta na regressão logística são bastante difíceis de interpretar diretamente. Portanto, relatá-los explicitamente é apenas de uso muito limitado. Você deve manter a razão de chances ou mesmo os efeitos marginais. O efeito marginal da variável x é a derivada da probabilidade de que suas variáveis ​​dependentes sejam iguais a 1, em relação a x. Essa maneira de apresentar resultados é muito popular entre os economistas. Pessoalmente, acredito que os efeitos marginais são mais facilmente compreendidos pelos leigos (mas não apenas por eles ...) do que as probabilidades.

Outra possibilidade interessante é usar telas gráficas. Um lugar onde você encontrará algumas ilustrações dessa abordagem é o livro de Gelman e Hill . Acho isso ainda melhor do que relatar efeitos marginais.

Com relação à pergunta sobre como obter odds ratio, eis como você pode fazer isso em R:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))

Você tem exemplos de transformar as estimativas efeito marginal em tabelas (ou referências específicas de página em Gelman e Hill?)
Andy W

1
Gelman e Hill realmente não usam os efeitos marginais, mas gráficos, que são baseados em probabilidades previstas. Dê uma olhada no capítulo cinco, começando na página 79.

10

É apenas em casos especiais que os coeficientes e seus anti-logs (odds ratio) são bons resumos. É quando as relações são lineares e existe um coeficiente associado a um preditor, e quando uma alteração de uma unidade é uma boa base para calcular a razão de chances (mais aceitável para a idade, não muito para a contagem de sangue branco com um intervalo de 500-100.000). Em geral, coisas como índices de chances entre os quartis são úteis. Tenho mais detalhes sobre isso em http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf e o rmspacote R faz tudo isso automaticamente (manipulação de termos e interações não-lineares, cálculo de quartis de X, etc.)


5

Provavelmente depende do seu público e disciplina. A resposta abaixo é o que normalmente é feito para os periódicos de Epidemiologia e, em menor grau, os periódicos médicos.

Para ser franco, não nos importamos com valores-p. Sério, nós não. A epidemiologia nem permite que você os relate, a menos que você tenha uma necessidade muito, muito urgente e o campo tenha seguido o mesmo caminho.

Podemos nem nos importar com estimativas beta, dependendo da pergunta. Se o seu relatório estiver orientado para algo mais metodológico ou de simulação, eu provavelmente reportaria a estimativa beta e o erro padrão. Se você estiver tentando relatar um efeito estimado na população, utilizarei o Odds Ratio e o intervalo de confiança de 95%. Essa é a base da sua estimativa e o que os leitores nesse campo estarão procurando.

As respostas foram postadas acima para saber como obter o odds ratio, mas para o OR & 95% CI:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)

obrigado pela resposta! posso perguntar o que o 1,96 significa no cálculo?
upabove

1
Não há problema :) O intervalo de confiança de 95% é o intervalo que deve cobrir aproximadamente do percentil 2,5 ao percentil 97,5 da distribuição normal de sua estimativa beta. Cada um desses pontos tem aproximadamente 1,96 desvios-padrão da média (neste caso, beta).
Fomite 23/08/19

sim, mas devo fazer isso para cada coeficiente beta? também muda o 1,96? também estes são dados binomiais, ainda é baseado na distribuição normal?
upabove

2
Sim - para cada coeficiente beta, você pode obter uma razão de chances e um limite de confiança de 95%. O 1,96 não será alterado, a menos que você deseje calcular um percentil diferente para o intervalo de confiança (90%, 99% etc.), mas como 95% é padrão, não há necessidade de fazê-lo. E enquanto você estiver trabalhando na escala de log, os parâmetros de um modelo de regressão logística são normalmente distribuídos. Depois de exponenciá-los, isso deixa de ser verdade.
Fomite 23/08
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.