Eu gosto de usar modelos de mistura heterogêneos para descrever efeitos combinados de fontes fundamentalmente diferentes.
Você pode olhar algo como um modelo "Zero Inflated Poisson" no estilo de Diane Lambert. " Regressão de Poisson inflada a zero, com aplicação a defeitos de fabricação ", Diane Lambert, Technometrics, vol. 34, Iss. 1, 1992
Acho essa idéia particularmente agradável porque parece contradizer a noção de que a aplicação do desenho estatístico de experimentos à medicina não pode curar completamente a doença. Por trás da noção, está a idéia de que o método científico não pode completar seu objetivo na medicina vem da idéia de que não existem dados sobre doenças de um indivíduo saudável "perfeitamente" e, portanto, que os dados não podem informar o remédio da doença. Sem medição, não há espaço para melhorar.
Usar algo como um modelo inflado a zero permite extrair informações úteis de dados que são parcialmente "livres de erros". Ele está usando a percepção do processo para pegar as informações que poderiam ser consideradas "silenciosas" e fazê-las falar. Para mim, esse é o tipo de coisa que você está tentando fazer.
Agora não posso começar a afirmar quais combinações de modelos usar. Suspeito que você possa usar um Modelo de Mistura Gaussiana com inflação zero (GMM) para iniciantes. O GMM é um pouco de um aproximador universal empírico para PDFs contínuos - como o primo PDF da aproximação da série Fourier, mas com o apoio do teorema do limite central para melhorar a aplicabilidade global e permitir tipicamente muitos menos componentes para criar um " boa "aproximação.
Melhor da sorte.
EDITAR:
Mais sobre modelos com inflamento zero: