A frequência alélica observada é significativamente menor que a prevista?


10

Pergunta : Como posso construir um teste para determinar se a frequência do alelo "montanha" observada (Fig 1) é significativamente mais baixa nas montanhas do centro-sul do que o previsto (Fig 2) pelo modelo de seleção ecológica ( veja detalhes abaixo )?

Problema : Meu pensamento inicial foi regredir os resíduos do modelo em relação à latitude: longitude e altitude (o que resulta apenas na interação entre latitude e longitude como significativa). O problema é que os resíduos (Fig. 3) podem refletir variações não explicadas pelo modelo e / ou que são algo biológico acontecendo, por exemplo, o alelo não teve tempo de se espalhar para o sul ao seu potencial ou existe alguma barreira ao fluxo gênico. Se você comparar as freqüências observadas (Fig. 1) versus as esperadas (Fig. 2) dos alelos das montanhas, haverá uma diferença óbvia, especialmente nas montanhas do centro ao sul da Suécia e da Noruega. Aceito que o modelo possa não explicar toda a variação, mas posso fazer um teste razoável para explorar a idéia de que o alelo da montanha não atingiu seu potencial nas montanhas do centro ao sul?

fundo: Eu tenho um marcador AFLP bi-alélico cuja distribuição de frequência parece estar associada a habitats de montanha (e latitude: longitude) versus habitats de planície na península escandinava (Fig. 1). O alelo "montanha" é quase fixo no norte, que é montanhoso. Está quase ausente ou corrigido para o alelo "planície" no sul, que carece de montanhas. Quando se move de norte a sul nas montanhas, o alelo "montanha" ocorre em menor frequência. Essa diferença na frequência do alelo "montanha" de norte a sul pode ser simplesmente devida a filogeografia ou processos históricos, já que a região foi colonizada pelo norte e pelo sul. Por exemplo, se o alelo da montanha se origina na população do norte, talvez ele não tenha tido tempo de se expandir totalmente na população do sul,

Minha hipótese de trabalho é que a frequência do alelo "montanha" é resultado da seleção ecológica (hipótese nula é seleção neutra).

Para o meu modelo de seleção ecológica, usei um modelo aditivo generalizado (GAM) com a frequência do alelo binomial como variável de resposta (129 locais amostrados na Fennoscandinavia com tipicamente 10 a 20 indivíduos amostrados em cada local) e várias variáveis ​​climáticas e da estação de crescimento como as variáveis ​​preditoras. Os resultados do modelo são os seguintes (TMAX04-06 = temperatura máxima em abril-junho, Phen_NPPMN = produtividade média da vegetação na estação de crescimento, PET_HE_YR = evapotranspiração potencial anual, Dist_Coast = distância da costa):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

insira a descrição da imagem aqui

Figura 1. Frequência do alelo "montanha" observada para o marcador AFLP bi-alélico. Linhas de contorno 0,1 intervalos de frequência, sombreamento de cores é a altitude com azuis para os mais baixos e vermelhos mais altos.

insira a descrição da imagem aqui

Figura 2. Frequência prevista do alelo "montanha" para o marcador AFLP bi-alélico. Linhas de contorno 0,1 intervalos de frequência, sombreamento de cores é a altitude com azuis para os mais baixos e vermelhos mais altos.

insira a descrição da imagem aqui

Figura 3. Resíduos do modelo de seleção ecológica (usando GAM) discriminados por toda a área de estudo (Fennoscandinavia) e separadamente para Noruega, Suécia e Finlândia. As linhas tracejadas vermelhas representam uma zona de contato secundária entre as populações norte e sul inferidas a partir de outros marcadores da AFLP e uma análise isotópica estável das penas cultivadas em seus locais de inverno separados na África. A fina linha pontilhada preta é o centro da zona.


11
Obrigado pela grande quantidade de detalhes. Como o modelo nulo entra em questão? Parece que apenas o modelo de seleção ecológica é importante na comparação entre o observado e o esperado.
gui11aume

Quais são os seus dados reais aqui? A saída do modelo diz "n = 129", mas são 129 indivíduos ou 129 locais em cada um dos quais você tem frequências alélicas ou ...?
onestop 01/07/2012

Desculpe, eu queria fornecer o máximo de informações possível para que todos pudessem entender melhor a lógica (ou ilógica) da minha abordagem para o manuscrito que estou desenvolvendo. Minha pergunta está no topo. Gostaria de descobrir por que determinar se a diferença entre o observado e o esperado é significativamente diferente. Isso pode me informar se o alelo ainda está se espalhando ou se há alguma barreira para atingir o valor esperado. Quanto ao "N = 129", como essa é uma frequência de alelo, isso significa 129 locais com tipicamente entre 10 e 20 indivíduos amostrados em cada local.
Keith Larson

Você menciona que os indivíduos parecem ser panmáticos para os locais maternos e automáticos. Você tem acesso a esses dados? Como você avaliou a panmixia?
Sameer

Respostas:


1

Essa pergunta pode estar morta, mas os gráficos aqui são lindos e a resposta aqui parece intuitivamente óbvia. Se você estiver procurando por um alelo "montanha", a escolha óbvia seria usar a altitude (ou algum substituto) como seu preditor. Se isso mostrasse uma associação significativa com a frequência do alelo, forneceria uma forte evidência para sua hipótese.

Você pode adicionar mais variáveis ​​preditivas que descrevem outros aspectos da montanha além de sua altitude - por exemplo, "rugosidade" do terreno ou tipo de vegetação - que são exclusivamente montanhosas e também podem estar associadas à frequência do alelo.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.