Variáveis ​​dependentes filogenéticas: ANOVA?


13

Eu entendo derivar uma matriz de covariância dos dados filogenéticos para fazer para duas variáveis que você está fazendo uma regressão diante. Mas o que acontece se você tiver uma variável contínua que anteriormente demonstrou ser dependente da filogenia e uma variável ordinal? Sendo este último ordinal, não tenho certeza de como relacionar isso à maneira pela qual a dependência filogenética resulta em estatísticas de teste tendenciosas.cov(X,Y)=0 0

É significativo calcular os contrastes independentes filogenéticos de Felsenstein em sua variável contínua e usá-los para sua ANOVA?

O valor PIC é:

CEuj=(XEu-Xj)dEuj

Onde é X para as espécies i , X j é X para espécies j , e de d i j é a distância entre pares entre espécies i e j sobre a árvore filogenética.XEuXEu,XjXjdEujEuj


1
Existem estatísticas estatísticas suficientes no CrossValidated que podemos considerar migrar para o site de estatísticas.
Daniel Standage

2
Eu recomendo a lista de discussão r-sig- phylo ( stat.ethz.ch/mailman/listinfo/r-sig-phylo ). Mesmo se você não estiver usando R para sua análise, obterá respostas muito boas para sua pergunta.
kmm 01/02/12

Respostas:


1

A primeira etapa que eu recomendaria é introduzir uma variável fictícia para cada classe ordinal (consulte os comentários em https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta .edu / faculdade / kunovich / Soci5304_Handouts / Tópico% 25208_Dummy% 2520Variables.doc & cd = 2 & ved = 0CCAQFjAB & usg = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ & sig2 = 9hkDU6Ymp4 ) Você também pode testar uma tendência nas próprias variáveis ​​fictícias. Você também reordena a categoria de variável ordinal de acordo com a magnitude estimada respectiva das variáveis ​​dummy para análise subsequente, se houver uma justificativa prévia (para ver os dados atuais) para fazê-lo.

Assumindo que a análise anterior está perdendo um efeito de tendência crescente (não necessariamente linear) e incorporando qualquer ordem suportável na própria variável ordinal, uma abordagem interessante que também trata de possíveis problemas de normalidade é executar uma análise de regressão na qual todas as variáveis ​​recebem classificações, incluindo a variável ordinal. Uma justificativa para essa loucura, para citar a Wikipedia no coeficiente de correlação de classificação de Spearman (link: http://en.m.wikipedia.org/wiki/Spearman 's_rank_correlation_coefficient):

"O coeficiente de Spearman, como qualquer cálculo de correlação, é apropriado para variáveis ​​contínuas e discretas, incluindo variáveis ​​ordinais. [1] [2]"

A Wikipedia apresenta um exemplo e várias maneiras de avaliar o erro padrão da correlação de classificação computada para teste. Observe que, se não for estatisticamente diferente de zero, uma versão em escala, como em uma regressão computada baseada em classificações, é similarmente não significativa.

Eu normalizaria ainda mais essas classificações (dividindo pelo número de observações), fornecendo uma possível interpretação quantil da amostra (observe que existem possíveis refinamentos na construção da distribuição empírica para os dados em questão). Eu também realizaria uma correlação simples entre ye uma determinada variável ordinal transformada, para que a direção do seu ranking selecionado (por exemplo, 1 a 4 versus 4 a 1) produza um sinal para a correlação de classificação que tem um significado intuitivo no contexto do seu estudo.

[Editar] Observe que os modelos ANOVA podem ser apresentados em formato de regressão com a matriz de design apropriada e com qualquer modelo de regressão padrão que você investigue, o tema central é uma análise baseada em média de Y, dado X. No entanto, em algumas disciplinas como ecologia, um foco diferente nas relações de regressão implícitas em vários quantis, incluindo a mediana, mostrou-se proveitoso. Aparentemente, na ecologia, os efeitos médios podem ser pequenos, mas não necessariamente em outros quantis. Esse campo é chamado de regressão quantílica. Eu sugeriria que você o empregasse para complementar sua análise atual. Como referência, você pode encontrar o Documento 213-30, "Uma Introdução à Regressão Quantil e o Procedimento QUANTREG", de Colin (Lin) Chen, no Instituto SAS.

Aqui também está uma fonte sobre o uso de transformações de classificação: "O uso de transformações de classificação em regressão", de Ronald L. Iman e WJ Conover, publicado em Technometrics, Vol. 21, nº 4, novembro de 1979. O artigo observa que as regressões empregar transformações de classificação parece funcionar muito bem em dados monotônicos. Essa opinião também é compartilhada por profissionais de confiabilidade, que declaram em uma revista on-line, para citar: "O método de estimativa de regressão de classificação é bastante bom para funções que podem ser linearizadas". Fonte: "Confiabilidade Hotwire, edição 10, dezembro de 2010.


um usuário anônimo está tentando fazer edições bastante extensas (IMO) em sua postagem. Se você não concordar com eles, poderá revertê-los clicando no link "editado __ atrás", localizando a última versão de sua preferência e clicando em "retroceder".
gung - Restabelece Monica

0

Um teste ANOVA filogenético foi desenvolvido por Garland et al. (1993) e é implementado na phy.anovafunção no geigerpacote. O método produz valores de p corrigidos para a não independência filogenética, gerando uma distribuição nula com base na simulação da evolução na filogenia.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.