Existem várias soluções para o caso de distribuições contínuas semi- infladas a zero:
- Regressão Tobit : assume que os dados provêm de uma única distribuição Normal subjacente, mas que valores negativos são censurados e empilhados em zero (por exemplo, pacote censReg )
- obstáculo ou modelo de "dois estágios": use um modelo binomial para prever se os valores são 0 ou> 0 e, em seguida, use um modelo linear (ou Gamma, ou Normal truncado ou Log-Normal) para modelar os valores diferentes de zero observados
- 1 1 < p < 2x > 0
Ou, se sua estrutura de dados é bastante simples, você pode simplesmente usar modelos lineares e usar testes de permutação ou alguma outra abordagem robusta para garantir que sua inferência não seja prejudicada pela interessante distribuição dos dados.
Existem pacotes / soluções R disponíveis para a maioria desses casos.
Há outras perguntas sobre SE sobre dados contínuos (semi) zero inflacionados (por exemplo, aqui , aqui e aqui ), mas eles não parecem oferecer uma resposta geral claro ...
Veja também Min & Agresti, 2002, Modelando Dados Não Negativos com Agrupamento em Zero: Uma Pesquisa para uma visão geral.