Teste de significância de três ou mais correlações usando a transformação de Fisher


9

Seguindo meus posts anteriores, até onde posso entender, se eu tiver três coeficientes de correlação, terei que testá-los em pares para ver se há uma diferença significativa entre eles.

Isso significa que eu precisaria usar a transformação Fishers para calcular a pontuação z de re, em seguida, o valor de p de z (que as calculadoras recomendadas nos posts anteriores fazem, felizmente) e depois verificar se o valor de p é maior ou menor que meu valor alfa (0,05) para cada par.

ou seja, se 21 a 30 anos for a faixa etária 1, 31 a 40 anos for a faixa etária 2 e 41 a 50 anos for a faixa etária 2, minha comparação das correlações entre seus hábitos de compra e perda de peso seria:

  • Grupo 1 vs. Grupo 2
  • Grupo 1 vs. Grupo 3
  • Grupo 2 vs. Grupo 3

Em vez de fazer três cálculos separados, existe uma maneira de fazer todos esses cálculos em uma única etapa?


11
Você poderia ser um pouco mais detalhado? Como em - qual é a sua resposta, suas variáveis ​​explicativas e em quais correlações você está interessado? Você pode não transformar de Fisher para testar a correlação; um simples teste t pode ser suficiente.
suncoolsu

@suncoolsu Estou testando a correlação entre hábitos de compra e ganho de peso para esses três grupos. Meus resultados são os seguintes: Grupo 1: r = 0,8978, n = 105; Grupo 2: r = 0,55678, n = 95; e Grupo 3: r = 0,7865, n = 120.
Adhesh Josh

Eu acho que seus dados passam a IOTT. Esse é o teste de trauma interocular - ele atinge você entre os olhos. Se as correlações de .9, .6 e .8 não são diferentes entre si, o que é? Mas se você estiver realmente interessado
Peter Flom - Reinstate Monica

Respostas:


4

Sua pergunta é um exemplo perfeito de modelos de regressão com preditores quantitativos e qualitativos . Especificamente, os três grupos etários - - são as variáveis ​​qualitativas e as variáveis ​​quantitativas sãohábitos de compraeperda de peso(acho que sim, porque você está calculando correlações).1,2,&3

Devo enfatizar que essa é uma maneira muito melhor de modelar do que calcular correlações separadas por grupo, porque você tem mais dados para modelar; portanto, suas estimativas de erro (valores-p, etc.) serão mais confiáveis. Uma razão mais técnica é o maior grau de liberdade resultante na estatística do teste t para testar a significância dos coeficientes de regressão.

Operando pela regra de que preditores qualitativos podem ser manipulados por variáveis ​​indicadoras c - 1 , apenas duas variáveis ​​indicadoras, X 1 , X 2 , são necessárias aqui, definidas da seguinte forma:cc1 1X1 1,X2

X 2 = 1  se a pessoa pertencer ao grupo 2 ; 0  caso contrário .

X1 1=1 1 se a pessoa pertencer ao grupo 1;0 0 de outra forma.
X2=1 1 se a pessoa pertencer ao grupo 2;0 0 de outra forma.

Isso implica que o grupo é representado por X 1 = 0 , X 2 = 0 ; representar a sua resposta - compras hábito como Y e quantitativa da perda de peso variável explicativa como W . Agora você se encaixa neste modelo linear3X1 1=0 0,X2=0 0YW

A pergunta óbvia é que importa se alteramos W e Y (porque escolhi aleatoriamente os hábitos de compra como variável de resposta). A resposta é sim - as estimativas dos coeficientes de regressão mudarão, mas o teste de "associação" entre condicionados em grupos (aqui teste t, mas é o mesmo que testar a correlação para uma única variável preditora) não mudança. Especificamente,

E[Y]=β0 0+β1 1X1 1+β2X2+β3W.
WY

E [ Y ] = ( β 0 + β 2 ) + β 3 W  - para o segundo grupo , E [ Y ] = ( β 0 + β 1 ) + β 3 W  - para o primeiro grupo , é equivalente a ter 3 linhas separadas, dependendo dos grupos, se você desenhar Y

E[Y]=β0 0+β3W - para o terceiro grupo,
E[Y]=(β0 0+β2)+β3W - para o segundo grupo,
E[Y]=(β0 0+β1 1)+β3W - para o primeiro grupo,
Yvs . Essa é uma boa maneira de visualizar o que você está testando faz sentido (basicamente uma forma de EDA e verificação de modelo, mas você precisa distinguir adequadamente as observações agrupadas). Três linhas paralelas indicam nenhuma interação entre os três grupos e W , e muita interação implica que essas linhas se cruzarão.WW

Como fazem os testes que você pergunta. Basicamente, depois de ajustar o modelo e obter as estimativas, você precisa testar alguns contrastes. Especificamente para suas comparações:

Grupo 2 x Grupo 3: β2+β0 0-β0 0=0 0,
Grupo 1 vs Grupo 3: β1 1+β0 0-β0 0=0 0,
Grupo 2 x Grupo 1: β2+β0 0-(β0 0+β1 1)=0

Testar a equivalência de inclinações é diferente de testar a equivalência de correlações. Veja, por exemplo: jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Wolfgang

t=ρn-21 1-ρ2tn-2

Além disso, seu documento fala sobre a comparação de diferentes populações, o que não é o caso de um único preditor.
suncoolsu

H0:β1=β2=β3H0 0:ρ1 1=ρ2=ρ3β

Sim, você está certo (como eu disse antes), mas minha resposta pressupõe que o OP estava interessado em determinar a relação entre perda de peso e hábitos de compra com base em grupos (não necessariamente correlação). Acho que estava errado porque o OP aceitou a outra resposta. No entanto, essa resposta serve como uma alternativa útil (espero).
suncoolsu 5/09/11

1

O teste em pares nesta situação não é (ainda) justificado pela descrição dos dados. Você deve usar métodos de regressão multivariáveis. Uma chamada R pode ser:

lm( weight_end ~ shop_habit + age_grp + weight_begin)

Construir 3 categorias não é o melhor método para controlar a idade (ou analisar sua contribuição, se essa for a questão principal), pois a categorização pode distorcer os relacionamentos contínuos, e os termos das splines removem a necessidade de escolher pontos de divisão arbitrários. Uma vez que exista evidência suficiente de uma associação de alteração de peso após uma análise adequada, haverá opções de teste ad-hoc que podem ser implementadas.

(Eu concordei com a maior parte do que @whuber expressou em um comentário, e geralmente considero seu comentário autoritário, mas não entendo sua posição em relação às abordagens de regressão.)

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.