quando executei alguns exemplos, os valores de p para rho e o teste t da correlação de Pearson de classificações sempre coincidiam, exceto os últimos dígitos
Bem, você está executando os exemplos errados então!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
a
b
ρb
Por outro lado, embora a
e b
tenham uma correlação de classificação perfeita, o coeficiente de correlação de Pearson é menor que 1. Isso mostra que a correlação de Pearson não está refletindo as classificações.
Uma correlação de Pearson reflete uma função linear, uma correlação de classificação simplesmente uma função monotônica. No caso de dados normais, os dois se assemelham fortemente e suspeito que é por isso que seus dados não mostram grandes diferenças entre Spearman e Pearson.
Para um exemplo prático, considere o seguinte; você quer ver se as pessoas mais altas pesam mais. Sim, é uma pergunta boba ... mas apenas assuma que é com isso que você se importa. Agora, a massa não escala linearmente com o peso, pois as pessoas altas também são mais largas que as pequenas; então o peso não é uma função linear da altura. Alguém que é 10% mais alto que você é (em média) mais de 10% mais pesado. É por isso que o índice de massa corporal usa o cubo no denominador.
Consequentemente, você assumiria uma correlação linear para refletir imprecisa a relação altura / peso. Em contraste, a correlação de classificação é insensível às leis irritantes da física e da biologia neste caso; não reflete se as pessoas crescem mais linearmente à medida que ganham em altura, simplesmente reflete se as pessoas mais altas (mais altas na classificação em uma escala) são mais pesadas (mais altas na outra escala).
Um exemplo mais típico pode ser o das classificações de questionários do tipo Likert, como pessoas classificando algo como "perfeito / bom / decente / medíocre / ruim / horrível". "perfeito" está tão longe de "decente" quanto "decente" está em "ruim" na balança , mas podemos realmente dizer que a distância entre os dois é a mesma? Uma correlação linear não é necessariamente apropriada. A correlação de classificação é mais natural.
Para abordar sua pergunta mais diretamente: não, os valores de p para correlações de Pearson e Spearman não devem ser calculados de maneira diferente . Muito é diferente entre os dois, conceitualmente e numericamente, mas se a estatística do teste for equivalente, o valor de p será equivalente.
Sobre a questão de uma suposição de normalidade na correlação de Pearson, veja isso .
De maneira mais geral, outras pessoas elaboraram muito melhor do que eu sobre o tópico correlações paramétricas versus não paramétricas (também veja aqui ) e o que isso significa em relação a suposições distributivas.