Como testar as diferenças entre as medianas de vários itens do Likert?

8

Em um estudo de questionário, pedimos aos entrevistados que expressassem suas atitudes em relação a como os diferentes fatores climáticos do inverno, como neve e escorregadio, podem afetar sua escolha de caminhar e andar de bicicleta para trabalhar. A amostra composta por 500 indivíduos e as respostas foram em forma de 5 escalas, de forma muito negativa a muito positiva (escala ordinal).

Se eu quiser comparar as respostas a diferentes perguntas, acho que a mediana é uma ferramenta adequada, pois os dados são ordinais. Sei que comparar significa que existem diferentes testes estatísticos para mostrar se a probabilidade de diferença é significativa (teste t ou teste não paramétrico ..). Mas estou um pouco confuso se posso usar esses testes no tipo de dados que expliquei aqui.

Existe uma estatística de teste para comparar medianas?
Ou devo transferir dados para uma escala de intervalo, se for apropriado?

likert median ordinal-data

— Saeed
fonte

4

Acho que a média é um indicador muito mais útil da tendência central dos itens Likert do que a mediana. Eu elaborei meu argumento aqui em uma pergunta perguntando se deve usar a média ou a mediana para itens do tipo likert .

Uma recapitulação de alguns destes motivos:

A média é mais informativa; a mediana é muito bruta para itens do Likert. Por exemplo, a mediana de 1 1 3 3 3é igual a 3 3 3 5 5(ou seja, 3), mas a média reflete a diferença.
Os itens Likert são frequentemente formulados de maneiras em que a distância igual entre as suposições de categorias é um ponto de partida útil.
Mesmo que as respostas individuais sejam discretas, a medição no nível do grupo se aproxima da continuidade (com 500 pessoas e uma escala de 5 pontos, o valor da sua média pode assumir 500 * 4 + 1 = 2001valores diferentes)
Há pouco argumento de que uma porcentagem seja um resumo útil em perguntas do tipo sim-não (por exemplo, votação). Este é apenas o meio em que as respostas foram codificadas 0 and 1. Tratar uma escala likert de 5 pontos como 1 2 3 4 5parece quase tão natural para mim.
Outras escalas plausíveis dos itens do Likert provavelmente não mudarão inferências substancialmente quanto à existência de diferenças entre médias (mas você pode verificar isso).

Se você estiver convencido de que a média é a medida apropriada da tendência central, estruture seus testes de hipóteses para que eles testem as diferenças entre as médias. Um teste t de amostra pareada permitiria uma comparação de médias por pares, mas haveria problemas em torno da precisão dos valores de p, dada a distribuição de erro discreta e não normal. No entanto, adotar uma abordagem não paramétrica não é uma solução, pois altera a hipótese.

Eu esperaria que o teste t de amostra pareada fosse bastante robusto, pelo menos para itens típicos do Likert, que evitam extremos na escala, mas não tenho estudos de simulação à mão.

— Jeromy Anglim
fonte

2

Geralmente, eu concordo com os argumentos de Jeromy de que a média é uma estatística razoável para as escalas Likert. O que poderia falar pela mediana é que a mediana é uma medida de localização muito mais robusta, pois protege contra outliers (tem o maior ponto de decomposição possível de 50%). No entanto, como as escalas Likert são limitadas, a possibilidade de valores extremos extremos é muito baixa (somente se seus dados estiverem extremamente distorcidos). Além disso, a mediana geralmente elimina demais os dados, portanto, você pode considerar o uso de médias aparadas. Geralmente, recomenda-se um corte de 20% [1].

Se você deseja calcular um teste emparelhado da diferença de medianas, recomendo comparar as médias usando um método de autoinicialização por percentil (este é o único método para comparar medianas que funciona bem no caso de valores vinculados, consulte Wilcox, 2005 [ 1]).

No pacote WRS para R, existe uma função chamada trimpb2que faz esse cálculo para duas amostras independentes (você também pode calcular um valor de p para médias de compensação com essa função). No seu caso, no entanto, você precisa comparar grupos dependentes. Nesse caso, você também pode executar um método de bootstrap de percentil ajustado por viés [2].

Observe, no entanto, que a diferença das medianas das distribuições marginais não é a mesma que olhar para a mediana das pontuações das diferenças. O primeiro responde à pergunta 'Como a resposta típica do primeiro grupo difere do segundo' e é executado pela função WRS rmmcppb. O segundo responde à pergunta 'Qual é a pontuação da diferença típica' e é executado pela função WRS rmmcppbd.

[1] Wilcox, RR (2005). Introdução a estimativas robustas e testes de hipóteses. San Diego: Academic Press.

[2] Wilcox, RR (2006). Comparações pareadas de grupos dependentes com base em medianas. Estatística Computacional e Análise de Dados, 50, 2933-2941. doi: 10.1016 / j.csda.2005.04.017

— Felix S
fonte

0

Uma opção para comparar medianas são os testes de permutação . No entanto, se você estiver comparando as respostas 2 perguntas que foram preenchidas pelo mesmo conjunto de pessoas (dados emparelhados), também poderá consultar o teste de McNemar e as variações nele.

Para explicar um pouco, a idéia do teste de McNemar (e suas extensões) é examinar uma matriz com as contagens de quantos entrevistados escolheram as combinações, para que um indivíduo contribua para a contagem na célula cuja coluna é determinada por a resposta para a pergunta 1 e a linha são determinadas pela resposta à pergunta 2 (comandos de tabela ou cruzável criam a matriz). O padrão nessa matriz provavelmente será mais informativo do que uma média ou mediana simples. A diagonal representa as pessoas que responderam da mesma forma às 2 perguntas, o triângulo superior é o que respondeu mais alto na 1ª questão do que na 2ª questão e no triângulo inferior a diferença. A distância da diagonal indica a diferença entre as 2 respostas. Variações no teste de McNemar examinam se as contagens nos 2 triângulos são diferentes, ou se a matriz é simétrica. Para levar em conta a natureza ordinal (vs. nominal) dos dados, a distância da diagonal é levada em consideração.

Observar os padrões da tabela pode ser suficiente para seus propósitos, mas se você precisar de um teste formal, poderá seguir os testes sugeridos ou fazer alguma forma de teste de permutação (exatamente como depende do que você está procurando) ou tentando mostrar).

— Greg Snow
fonte

3

O teste de McNemar é para dados nominais. Para dados ordinais, como aqui, as pessoas geralmente escolhem o teste de classificação assinado por Wilcoxon ou o teste de sinal (mas o poder deste último tende a ser baixo).

— whuber

O problema com a pergunta de Saeed é que eles exigiam comparação de medianas de distrações relacionadas , e não independentes. O teste t de amostra pareada, podemos dizer, compara médias , porque seu numerador - a média das diferenças por caso - é o mesmo valor da diferença entre as duas médias. Mas, para mediana, a mediana das diferenças por caso não é o mesmo valor que a diferença entre as duas medianas. Portanto, duvido que exista um teste que possa ser chamado exatamente de "teste de medianas para amostras emparelhadas".

— ttnphns