Kendall Tau ou o rho de Spearman?


69

Em quais casos um deve preferir um ao outro?

Encontrei alguém que reivindica uma vantagem para Kendall, por razões pedagógicas , existem outras razões?


Consulte também uma pergunta relacionada stats.stackexchange.com/q/18112/3277 .
ttnphns

11
Infelizmente, o link da sua pergunta está morto. Suponho que você esteja se referindo a Noether (2007, Teaching Statistics ) . Deseja editar?
S. Kolassa - Restabelece Monica

Respostas:


40

Descobri que a correlação de Spearman é usada principalmente no lugar da correlação linear usual quando se trabalha com pontuações com valores inteiros em uma escala de medição, quando há um número moderado de pontuações possíveis ou quando não queremos confiar nas suposições sobre os relacionamentos bivariados . Em comparação com o coeficiente de Pearson, a interpretação do tau de Kendall me parece menos direta que a do rho de Spearman, no sentido de quantificar a diferença entre a% de pares concordantes e discordantes entre todos os possíveis eventos pares. No meu entendimento, o tau de Kendall se parece mais com Goodman-Kruskal Gamma .

Acabei de pesquisar um artigo de Larry Winner no J. Statistics Educ. (2006) que discute o uso de ambas as medidas, Resultados da Corrida NASCAR Winston Cup para 1975-2003 .

Também achei a resposta da @onestop sobre a correlação de Pearson ou Spearman com dados não normais interessantes a esse respeito.

De nota, tau de Kendall (a uma versão) tem ligação com Somers' D (e C do Harrel) utilizados para a modelação de previsão (ver, por exemplo, Interpretação de Somers' D em quatro modelos simples por RB Newson e de referência 6 no seu interior, e artigos de Newson publicado no Stata Journal 2006). Uma visão geral dos testes de soma de classificação é fornecida em Cálculo eficiente de intervalos de confiança de Jackknife para estatísticas de classificação , publicado no JSS (2006).


Obrigado chl pela resposta, aceitei pelo escopo completo. Melhor, Tal
Tal Galili

Spearman usado em duas variáveis ​​inteiras regularmente compara sobre empates, que parecem ser mais bem tratados pelo tau de Kendall.
vinnief

29

Refiro o senhor a minha resposta anterior : "... os intervalos de confiança para r S de Spearman são menos confiáveis ​​e menos interpretáveis ​​que os intervalos de confiança para os parâmetros τ de Kendall", de acordo com Kendall & Gibbons (1990).


11
Acho que os agradecimentos são devidos a Roger Newson, como estou citando apenas no artigo dele.
onestop 31/10/10

22

Novamente uma resposta filosófica; a diferença básica é que o Rho de Spearman é uma tentativa de estender a idéia R ^ 2 (= "variância explicada") sobre interações não lineares, enquanto o Tau de Kendall se destina a ser uma estatística de teste para o teste de correlação não linear. Portanto, Tau deve ser usado para testar correlações não-lineares, Rho como extensão R (ou para pessoas familiarizadas com R ^ 2 - explicar Tau a platéias inocentes em tempo limitado é doloroso).


6
você poderia explicar "interações não lineares". O Spearman Rho parece refletir uma medida do coeficiente de validade em termos de psicometria. Eu não sei sobre a natureza do Tau.
Subhash C. Davar

Eu não entendo a coisa da psicometria do seu comentário.
Léo Léopold Hertz 준영

11
xx2

11
Isso só é verdade quando x é não negativo.
aocall

17

Aqui está uma citação de Andrew Gilpin (1993) defendendo o τ de Kendall sobre o ρ de Spearman por razões teóricas:

"[O de Kendall se aproxima de uma distribuição normal mais rapidamente que , à medida que , o tamanho da amostra aumenta; e também é mais tratável matematicamente, principalmente quando há vínculos". τρNτ

Referência

Gilpin, AR (1993). Tabela para conversão de Tau de Kendall em Rho de Spearman no contexto de medidas de magnitude de efeito para metanálise. Medida educacional e psicológica, 53 (1), 87-92.


3

FWIW, uma citação de Myers & Well (desenho de pesquisa e análise estatística, segunda edição, 2003, p. 510). Se você ainda se importa com os valores-p;

Seigel e Castellan (1988, estatística não paramétrica para as ciências do comportamento) apontam que, embora e Spearman geralmente tenham valores diferentes quando calculados para o mesmo conjunto de dados, quando testes de significância para e Spearman são baseados em suas distribuições amostrais, elas produzirão os mesmos valores de p .τρτρ


Você sabe se eles oferecem algum suporte para essa reivindicação? Não vejo como isso pode realmente ser verdade em geral (eles podem ser bastante parecidos, mas realmente não vejo como a afirmação de que eles serão os mesmos pode se sustentar). [Eu me pergunto se Siegel e Castellan realmente disse exatamente isso, ou algo um pouco diferente.]
Glen_b

Eu verifiquei Siegel & Castellan (2ed p253). Eles dizem algo um pouco diferente ... mas na verdade é um pouco pior do que a paráfrase acima, mesmo com a adição de "aproximadamente" (pior porque eles restringem o caso sob o nulo, mas como eles estão condicionando os dados De qualquer forma, para uma ordem fixa de , todas as ordens possíveis de classificação de são igualmente prováveis ​​em H0.) O fato de pensarem que condicionar o nulo após condicionar os dados é preocupante. Pergunto-me se queria dizer outra coisa ou se eles realmente entendam malxy
Glen_b

Como um contra-exemplo, tome n = 7 e p-valores exatos. Seja x = 1,2,3,4,5,6,7 e deixe y = 2,1,4,3,7,6,5 ... lanceiro dá p = 0,048, Kendall dá 0,136 ... que são nem um pouco. Um arranjo diferente fornece o mesmo valor para kendall, mas spearman tem p = 0,302. Existem muitos exemplos e vários tamanhos da amostra
Glen_b

3
Aqui está um gráfico para o caso n = 8. Como você pode ver que há um monte de variação entre os valores de p para as duas medidas de correlação: i.stack.imgur.com/5JMbj.png ... I pode escrever um Q & A sobre este
Glen_b

11
Aqui estão dois exemplos de conjuntos de dados (após a classificação) que mostram dois casos (desta vez com n = 9) em que os valores de p de correlação de Spearman são os mesmos, mas os valores de p de correlação de Kendall são bem diferentes: i.stack.imgur. com / 3ILD8.png
Glen_b
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.