Estou tentando ajudar um aluno de um colega. O aluno observou e contou o comportamento das aves (número de chamadas) em uma configuração experimental. O número de chamadas atribuíveis a uma ave observada específica durante cada experimento não pôde ser determinado, mas foi possível contar o número de aves que contribuíram para o número de chamadas gravadas. Portanto, minha sugestão inicial foi incluir o número de aves como termo de compensação em um modelo de Poisson GLM, portanto, estaríamos ajustando o número esperado de chamadas por ave .
O problema disso é que, durante muitas ocasiões de observação, nenhum pássaro (e, portanto, nenhum canto) foi observado. O software (R neste caso) reclama porque (R reclama por conter dados, mas isso é puramente o resultado de ser ).y
-Inf
offset(log(nbirds))
-Inf
Na verdade, suspeito que precisamos de um modelo de barreira (ou similar) em que tenhamos um modelo binomial separado para "chamadas observadas?" (ou não) e um modelo de contagem truncado para o número de chamadas (por ave) em situações em que houve chamadas, nas quais incluímos o termo de compensação apenas na parte de contagem do modelo.
Tendo tentado isso usando o pacote pscl no R, mas ainda estou recebendo o mesmo erro:
mod1 <- hurdle(NumberCallsCOPO ~ Condition * MoonVis +
offset(log(NumberCOPO)) | 1, data = Data,
dist = "poisson")
porque o mesmo código R ( glm.fit
usado internamente hurdle()
para ajustar a parte do modelo de contagem) está sendo verificado -Inf
, embora eu não ache que isso afetaria o ajuste do modelo para essas observações. (Isso é uma suposição correta?)
Posso ajustar o modelo adicionando um número pequeno a NumberCOPO
(digamos 0.0001
), mas isso é uma farsa, na melhor das hipóteses.
Adicionar esta pequena correção de continuidade seria bom na prática? Caso contrário, que outras abordagens deveríamos considerar ao lidar com dados em que podemos usar um deslocamento em um modelo de Poisson em que a variável de deslocamento pode assumir o valor 0? Todos os exemplos que encontrei são para situações em que um 0 não seria possível para a variável de deslocamento.