Estou estudando distúrbios causados pelo tráfego de navios para pequenas aves marinhas. Observei os animais focais por um período determinado e registrei se eles voavam ou não da água durante a observação. Este pássaro em particular não voa com altas probabilidades quando não é perturbado (cerca de 10% do tempo). Post hoc, acrescentei a distância do navio mais próximo a cada observação (os navios de interesse tinham localizadores de GPS registrando um ponto a cada 5 s).
Plotamos a função de distribuição cumulativa para TODAS as observações e para as observações em que o pássaro voou da água em função da distância do navio mais próximo. Como esperado, a maioria das observações nas quais o pássaro voou foi observada quando o navio estava perto.
Posso usar o teste Kolmogorov-Smirnov para testar se há uma diferença estatística na distribuição das observações de voo e no total de observações? Meu pensamento é que, se essas duas distribuições forem diferentes, isso sugere que a distância do navio influencia o vôo. Eu me preocupo porque essas funções de distribuição não são independentes, pois as observações de vôo são um subconjunto do total de observações.
Pensamentos?
Depois de ler um pouco mais sobre este site, acho que posso testar a distribuição das observações nas quais o voo ocorreu (F) e a distribuição das observações nas quais não ocorreu (NF), pois são independentes. Se essas distribuições são as mesmas F = NF, podemos assumir que a distribuição de (F) e (TOT = todas as observações) é a mesma que sabemos que a distribuição de (F) é igual a si mesma e (F) + (T) = (TOT). Direita?
ATUALIZAÇÃO: 12/2/14
Seguindo as sugestões de @ Scortchi, investiguei a relação da incidência de vôo versus distância com o navio mais próximo em uma estrutura de regressão logística. Houve uma pequena relação presente (inclinação negativa), mas o valor de p não foi significativo, sugerindo que a inclinação verdadeira poderia ser zero. Com base nas estatísticas descritivas (incluindo as plotagens de ecdf), suspeitei que o efeito de navios próximos estivesse sendo abafado pelas muitas observações quando o navio não estava afetando o comportamento. Em seguida, usei o pacote R segmentado ( http://cran.r-project.org/web/packages/segmented/segmented.pdf) para tentar encontrar um ponto de interrupção no modelo. O programa descobriu que quebrar os dados a 2,6 km do navio e ajustar dois coeficientes separados era melhor que o modelo de coeficiente único. O coeficiente para a inclinação da aproximação de navios próximos foi negativo e sugere que os navios afetem a resposta do voo até cerca de 2,6 km (valor de p <0,001). O coeficiente para o segundo declive foi ligeiramente positivo, mas o valor de p não foi significativo no nível alfa de 0,05 (valor de p = 0,11). Portanto, em resumo, a linha de regressão segmentada foi capaz de detectar uma diferença de limiar na qual a probabilidade de vôo aumenta. A estimativa para a probabilidade de vôo quando o navio estiver além de 2,6 km é de 0,11. Apropriadamente, observei 79 aves quando nenhum navio estava na baía de estudo (>
Obrigado por todas as sugestões. Espero que esta pergunta, juntamente com as sugestões e respostas, ajude outras pessoas.