É apropriado tratar dados da escala Likert de n pontos como n tentativas de um processo binomial?


11

Nunca gostei de como as pessoas normalmente analisam dados das escalas Likert como se o erro fosse contínuo e gaussiano quando há expectativas razoáveis ​​de que essas suposições sejam violadas, pelo menos nos extremos das escalas. O que você acha da seguinte alternativa:

Se a resposta receber o valor em uma escala de pontos, expanda esses dados para tentativas, com o valor 1 e com o valor 0. Portanto, trataremos a resposta em uma escala Likert como se é o agregado manifesto de uma série secreta de ensaios binomiais (de fato, do ponto de vista da ciência cognitiva, esse é realmente um modelo atraente para os mecanismos envolvidos em tais cenários de tomada de decisão). Com os dados expandidos, agora você pode usar um modelo de efeitos mistos especificando o respondente como um efeito aleatório (também faça uma pergunta como um efeito aleatório se você tiver várias perguntas) e use a função de vínculo binomial para especificar a distribuição de erros.n n k n - kknnknk

Alguém pode ver alguma violação de suposição ou outros aspectos prejudiciais dessa abordagem?


2
Você conhece alguma pesquisa publicada que analise os méritos relativos do uso de escalas likert como intervalos versus dados ordinais? Talvez as falhas de tratá-las como escalas de nível de intervalo não sejam suficientemente graves para justificar uma abordagem complexa. Se for esse o caso, então sua abordagem pode ser simplesmente uma loucura.

Respostas:


16

Não conheço nenhum artigo relacionado à sua pergunta na literatura psicométrica. Parece-me que modelos logísticos ordenados que permitem componentes de efeito aleatório podem lidar com essa situação muito bem.

Concordo com o @Srikant e acho que um modelo de probabilidades proporcionais ou um modelo de probit ordenado (dependendo da função de link que você escolher) pode refletir melhor a codificação intrínseca dos itens do Likert e seu uso típico como escalas de classificação em pesquisas de opinião / atitude ou questionário .

Outras alternativas são: (1) uso de categorias adjacentes, em vez de proporcionais ou cumulativas (onde existe uma conexão com modelos log-lineares); (2) uso de modelos de resposta a itens como o modelo de crédito parcial ou o modelo de escala de classificação (conforme mencionado em minha resposta na análise de escalas Likert ). O último caso é comparável a uma abordagem de efeitos mistos, com sujeitos tratados como efeitos aleatórios, e está prontamente disponível no sistema SAS (por exemplo, Ajustando modelos de efeitos mistos para resultados ordinais repetidos com o procedimento NLMIXED ) ou R (consulte o vol. 20 do Journal of Statistical Software ). Talvez você também esteja interessado na discussão de John Linacre sobre como otimizar a eficácia da categoria da escala de classificação .

Os seguintes documentos também podem ser úteis:

  1. Wu, CH (2007). Um estudo empírico sobre a transformação de dados da escala Likert em escores numéricos . Ciências Matemáticas Aplicadas , 1 (58) : 2851-2862.
  2. Rost, J e Luo, G (1997). Aplicação de um modelo de desdobramento baseado em Rasch a um questionário sobre centrismo de adolescentes . Em Rost, J e Langeheine, R (Eds.), Aplicações de características latentes e modelos de classes latentes nas ciências sociais , Nova York: Waxmann.
  3. Lubke, G e Muthen, B (2004). A análise fatorial dos dados da escala Likert sob a suposição de normalidade multivariada complica uma comparação significativa dos grupos observados ou classes latentes . Modelagem de Equações Estruturais , 11 : 514-534.
  4. Nering, ML e Ostini, R (2010). Manual de modelos de teoria de resposta de itens politômicos . Routledge Academic
  5. Bender R e Grouven U (1998). Usando modelos de regressão logística binária para dados ordinais com probabilidades não proporcionais. Journal of Clinical Epidemiology , 51 (10) : 809-816. (Não é possível encontrar o pdf, mas este está disponível, Regressão logística ordinal na pesquisa médica )

1
A regressão logística ordinal de efeitos mistos também está disponível em R com o pacote ordinal e clmm ().
John

9

Se você realmente deseja abandonar a suposição de dados no nível de intervalo para escalas likert, sugiro que você assuma que os dados sejam um logit ou probit ordenado. As escalas Likert geralmente medem a força da resposta e, portanto, valores mais altos devem indicar uma resposta mais forte no item de interesse subjacente.

Suponha que você tenha uma escala de item e que represente a força da resposta não observada no item de interesse. Então você pode assumir o seguinte modelo de resposta:SHS

S α 1y=1 seSα1

α h - 1 < S α h h = 2 , 3 , . . H - 1y=h  se paraαh1<S αhh=2,3,..H1

α H - 1 < S < y=H  seαH1<S< 

Assumir que segue uma distribuição normal com média e variância desconhecidas daria um modelo de probit ordenado.S


2

Uma preocupação seria que, usando essa abordagem, você imponha uma relação específica entre a média e a variação da resposta. Para o tipo de pesquisas, as escalas Likert são frequentemente usadas em - por exemplo, você escolhe uma das cinco categorias entre "concordo totalmente" a "discordo totalmente" com relação a uma afirmação ou outra - parece errado para mim. Por exemplo, eu esperaria que uma escala de dez pontos desse aproximadamente a mesma distribuição de respostas que uma escala de cinco pontos, se você recolher pares de categorias adjacentes: para uma resposta & comumnpnp(1p)yp

Prn=4(Y=y)Prn=9(Y=2y)+Prn=9(Y=2y+1)
Lembro-me de algumas pesquisas que parecem confirmar isso: Coelho & Esteves (2006), “A escolha entre uma escala de cinco e dez pontos no âmbito da medição da satisfação do cliente”.

1

Você poderia usar a aproximação binomial em uma escala Likert de 5 pontos se combinasse concordar e concordar fortemente em um grupo e discordar e discordar fortemente em outro. Claro, você ainda precisa decidir para onde vão os neutros. Eu colocaria os neutros em qualquer grupo, usaria a aproximação normal ao binômio (desde que você tenha mais de 40 respostas) e desenvolvesse intervalos de confiança nas proporções de cada grupo (consulte qualquer texto estatístico padrão sobre como obter conf. intervalos nas proporções provenientes de uma distribuição binomial com a aproximação normal). Depois, colocaria os neutros no outro grupo e refizeria os intervalos de confiança. Se eu obtiver a mesma conclusão de ambos, existe uma conclusão potencial. Caso contrário, não vejo como o binômio pode ser usado com os dados do Likert.


0

Se entendi corretamente, este artigo sugere uma abordagem muito semelhante ao que você descreveu, sugerindo que sim, de fato, dados do tipo Likert podem surgir de um processo binomial.

Referência completa: Allik, J. (2014). Um modelo binomial misto para medidas de personalidade do tipo Likert. Fronteiras em Psicologia , (5) 371


Bem vindo ao site! Você poderia adicionar uma referência completa para esse artigo? É prática padrão aqui, porque os links tendem a ficar mortos.
mkt - Restabelece Monica

-1

Na verdade, estou preparando um artigo no qual estou usando sua abordagem para tratar uma resposta em um item likert como se fosse o agregado aberto de uma série secreta de testes binomiais.

No meu artigo, a distribuição binomial é usada para explicar o formato das distribuições de frequência observadas. A lógica por trás dessa abordagem é dada por duas suposições. Em muitos applets, mostrando como a distribuição binomial passa a existir, repetimos ensaios independentes de Bernoulli com uma única bola caindo através de uma série de pinos. Cada vez que uma bola cai em um alfinete, ela salta para a direita (ou seja, um sucesso) com probabilidade p ou para a esquerda (ou seja, uma falha) com probabilidade 1-p. Depois que a bola cai através da matriz, ela cai em uma caixa rotulada pelo número correspondente de sucessos. No meu trabalho, o processo de tomada de decisão também é visto como uma série de repetidos ensaios independentes de Bernoulli, nos quais, em cada ensaio, o sujeito decide concordar ou não com a afirmação em questão.

(i) Em cada estudo independente de Bernoulli, o sujeito decide concordar com a probabilidade p ou não concordar (discordar) com a probabilidade 1-p.

(ii) Se cinco categorias de resposta estiverem disponíveis para a declaração, o número de vezes que uma decisão de Bernoulli é tomada com relação à decisão de concordar ou não (discordar) é igual a 4 (5-1).

A escolha final para uma categoria de resposta específica é dada pelas seguintes regras.

  • Se em todos os (quatro) casos uma decisão de acordo de Bernoulli for tomada, a resposta 'concordo totalmente' será dada.

  • Se em três casos for tomada uma decisão de acordo de Bernoulli, será dada a resposta 'concordar'.

  • Se em dois casos for tomada uma decisão de acordo de Bernoulli, será dada a resposta "indecisa".

  • Se em apenas um caso for tomada uma decisão de acordo de Bernoulli, será dada a resposta 'discordo'.

  • Se em nenhum caso for tomada uma decisão de acordo de Bernoulli, será dada a resposta 'discordo totalmente'.

Um raciocínio semelhante pode ser dado usando decisões de "discordo". Para obter uma distribuição binomial, a pontuação das categorias de resposta é a seguinte.

discordo totalmente = 0, discordo = 1, neutro = 2, concordo = 3, concordo totalmente = 4

Essas duas suposições levam a uma distribuição binomial para as frequências de resposta, desde que não haja diferenças sistemáticas entre os entrevistados.

Espero que você possa concordar. Eu agradeceria muito se você pudesse melhorar meu inglês no texto acima.


Eu removi sua resposta mais antiga. Observe que meu comentário não foi feito como uma observação negativa; as respostas de uma linha geralmente não são muito informativas e as respostas discutíveis devem ser preferidas (mas consulte nossas Perguntas frequentes ).
chl 02/02

1
Esta é uma proposta interessante e criativa, mas sou cética em relação a ela. Tanto na sua versão quanto na regressão logística ordinal, conforme sugerido, por exemplo, por outras pessoas neste segmento, será necessário o pressuposto proporcional das probabilidades. No entanto, o OLR permitirá que os limites / pontos de corte b / t das categorias variem com mais flexibilidade, acredito, enquanto serão determinados pelos parâmetros binomiais & em seu esquema. Essa suposição teria que ser verificada em relação aos dados, e suspeito, levaria a problemas. (BTW, o -1 não veio de mim.)npn
gung - Reinstate Monica
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.