Eu tenho 2 conjuntos de dados distribuídos exponencialmente e quero ter certeza de que eles são de diferentes distribuições. Infelizmente, um erro necessário na detecção dos dados me obriga a descartar todos os dados sob um determinado limite. Em cada conjunto, tenho cerca de 3000 pontos de dados e a plotagem dos dados me faz pensar que o valor lambda é diferente. O ajuste também gera valores diferentes para lambda.
Como posso ter certeza de que os dois conjuntos de dados são originários de uma distribuição diferente?
Aqui está um gráfico de como os conjuntos se parecem (observe que todos os valores em tempo de vida = 3seg precisam ser descartados):
ATUALIZAÇÃO: As distribuições acima são normalizadas em ambos os casos em N apenas para compará-las melhor em um gráfico porque o número total de pontos de dados N é diferente.
UPDATE2: Após o truncamento, tenho cerca de 150 valores vitalícios para o conjunto de dados vermelho e 350 para o conjunto de dados azul. Acontece que 3000 foi exagerado (me desculpe).
UPDATE3: Obrigado por me acompanhar. Aqui estão os dados brutos:
http://pastebin.com/raw.php?i=UaGZS0im
http://pastebin.com/raw.php?i=enjyW1uC
Até agora, ajustei uma função exponencial nos dois conjuntos de dados e comparei as inclinações. Como qualquer normalização não deve alterar a inclinação dos dados, diferentes inclinações devem implicar diferentes distribuições exponenciais subjacentes (minha experiência com análise estatística é muito limitada).
Os valores abaixo do limite são descartados porque a medição detecta muitos eventos com muita frequência nesse regime.
ATUALIZAÇÃO4: Acabei de perceber que meu problema é muito mais complicado do que eu pensava. Na verdade, eu deixei os dados censurados (não sei o início de alguns eventos) e os censos à direita (não sei o final de alguns eventos) E tenho que descartar todas as vidas abaixo de 3s (truncamento). Existe alguma maneira de incorporar tudo isso em uma análise? Até agora, encontrei alguma ajuda sobre como trabalhar com dados censurados (análise de sobrevivência), mas o que devo fazer com o truncamento?