Qual é o sentido de relatar estatísticas descritivas?


21

Acabei de realizar uma análise dos meus dados usando regressão logística, mas também sou obrigado a ter uma parte descritiva da Estatística no meu relatório. Sinceramente, não entendo o motivo disso e esperava que alguém pudesse explicar por que é necessário.

Por exemplo, se plotar um histograma de uma das minhas variáveis ​​contínuas independentes e mostrar normalidade ou assimetria, como isso agregará algum valor ao relatório?

Meus dados consistem em uma variável dependente, verdadeira ou falsa, de conseguir um emprego, e a variável independente são notas no meio do semestre, notas nos exames finais e masculino ou feminino.


Se você não consegue ver nenhum valor na plotagem de um histograma de seus IVs, talvez não deva fazer isso, mas existem dados coletados que você acha que têm algum valor para o trabalho em que você está apresentando o relatório?
Ian_Fin

Oi Ian, eu adicionei mais alguns detalhes sobre o meu problema. Eu sou bastante novo em estatística e estava me perguntando se existe uma abordagem geral que adotamos antes de realizar a regressão logística.
precisa saber é o seguinte

Sugiro também examinar e possivelmente incluir vários gráficos dos dados. Por exemplo, você pode plotar a nota final versus a nota intermediária, com código de cores por gênero e código de símbolo por "conseguiu emprego" e "não conseguiu conseguir emprego".
Emil M Friedman

Respostas:


42

No meu campo, a parte descritiva do relatório é extremamente importante, pois define o contexto para a generalização dos resultados. Por exemplo, um pesquisador deseja identificar os preditores de lesão cerebral traumática após acidentes de motocicleta em uma amostra de um hospital. Sua variável dependente é binária e ela tinha uma série de variáveis ​​independentes. A regressão logística multivariável permitiu que ela produzisse os seguintes achados:

  • nenhum uso de capacete ajustado OR = 4,5 (IC 95% 3,6, 5,5) comparado ao uso do capacete.
  • todas as outras variáveis ​​não foram incluídas no modelo final.

Para ser claro, não houve problemas com a modelagem. Nosso foco é o valor que as estatísticas descritivas podem adicionar.

Sem a estatística descritiva, um leitor não pode colocar essas descobertas em perspectiva. Por quê? Deixe-me mostrar as estatísticas descritivas:

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

Você pode ver pelo exposto acima que a amostra dela consistia em homens mais velhos e intoxicados. Com essas informações, o leitor pode dizer o que, se houver, esses resultados podem dizer sobre lesões em jovens do sexo masculino ou lesões em motociclistas não intoxicadas ou em motociclistas.

Por favor, não ignore as estatísticas descritivas.


5
Belo exemplo. É real ou inventado?
Ameba diz Reinstate Monica

5
Obrigado, @amoeba. Os números e estatísticas são reais. No entanto, mudei o tópico para lesão cerebral traumática para proteger os inocentes.

3
Então, homens bêbados andando de moto sem capacete ... Quem pensaria que você poderia acabar com uma lesão cerebral traumática?
gung - Restabelece Monica

I desfrutar de um copo de bom vermelho australiano no momento e Bob é seu tio ...

25

O objetivo de fornecer estatísticas descritivas é caracterizar sua amostra para que pessoas de outros centros ou países possam avaliar se seus resultados se generalizam para a situação deles. Portanto, no seu caso, tabular o sexo, as notas e assim por diante seria uma adição benéfica à regressão logística. Não é para permitir que as pessoas verifiquem suas suposições, embora possam tentar fazer isso também.

============== Editar para fornecer links para algumas diretrizes usadas na saúde

No campo com o qual eu estou familiarizado, saúde, existem diretrizes específicas para relatórios. Eles foram coletados juntos na rede EQUATOR, que deve ser consultada para obter detalhes atualizados.

Como exemplo, podemos fazer ensaios clínicos em que a diretriz relevante é CONSORT. No documento que descreve as diretrizes disponíveis aqui e em outros lugares , lemos na recomendação da Tabela 1 15 "Uma tabela mostrando as características demográficas e clínicas da linha de base para cada grupo".

Existem recomendações semelhantes para outros tipos de estudo.


Obrigado mdewey, por isso, quando fazemos o enredo descritivo e se observamos normalidade ou distorção, por que apenas comentar sobre ele. E assim, basicamente, as estatísticas descritivas são apenas reais para informar ao leitor quais dados você está trabalhando. Realmente, desculpe se isso pode parecer elementar #
31321919

É assim que funciona no campo da saúde, com o qual estou mais familiarizado.
Mdewey #

8
+1. No começo, eu interpretei errado "em outros centros ou países" como "em outros séculos".
Ameba diz Reinstate Monica

4

Outra coisa é mostrar como suas variáveis ​​se comportam. Se, por exemplo, uma de suas variáveis ​​é o salário, e você entrevistou exatamente um bilionário, quando você inserir o salário dele na regressão logística dominará sobre todo o resto, provavelmente aprenderá a ignorar o salário, independentemente de quanta informação real pode conter.

Alguns métodos são mais sensíveis do que outros à distorção e valores extremos, e a regressão logística é mais do lado sensível. Obviamente, a prova final está no pudim, e você pode comparar os resultados obtidos com os dados brutos ou com cada recurso transformado em normalidade.


1

Uma parte descritiva ajuda a entender o leitor do seu conjunto de dados. Na economia aplicada, geralmente é altamente recomendado, pois pode mostrar as primeiras falhas em potencial em sua análise.

Você pode usar dados de diferentes fontes para expandir seus descritivos.

1 mesa deve ser suficiente. O que você anexou não é muito intuitivo.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.