Você ainda pode estimar parâmetros usando a probabilidade diretamente. Seja as observações com a distribuição exponencial com rate e desconhecida. A função densidade é , função de distribuição cumulativa e a função de cauda . Suponha que as primeiras observações sejam totalmente observadas, enquanto que para sabemos apenas que para algumas constantes positivas conhecidas λ > 0 f ( x ; λ ) = λ e - λ x F ( x ; λ ) = 1 - e - λ x G ( x ; λ ) = 1 - F ( x ; λ ) = e - λ x r x r + 1 ,x1,…,xnλ>0f(x;λ)=λe−λxF(x;λ)=1−e−λxG(x;λ)=1−F(x;λ)=e−λxrx j > t j t j P ( X j > t j ) = G ( t j ; λ ) L ( λ ) = r ∏ i = 1 f ( x i ; λ ) ⋅ n ∏ i = r + 1 G ( t j ; λ ) l (xr+1,…,xnxj>tjtj. Como sempre, a probabilidade é a "probabilidade dos dados observados", para as observações censuradas, que são dadas por , então a função de probabilidade total é
A função de probabilidade de log torna-se
que tem a mesma forma da probabilidade de log para o caso usual e totalmente observado, exceto no primeiro termo em local de . Escrevendo para a média de observações e tempos de censura, o estimador de probabilidade máxima de se tornaP(Xj>tj)=G(tj;λ)
L(λ)=∏i=1rf(xi;λ)⋅∏i=r+1nG(tj;λ)
l(λ)=rlogλ−λ(x1+⋯+xr+tr+1+⋯+tn)
rlogλnlogλTλλ^=rnT , que você mesmo pode comparar com o caso totalmente observado.
EDIT
Para tentar responder à pergunta nos comentários: se todas as observações foram censuradas, ou seja, não esperamos o tempo suficiente para observar qualquer evento (morte), o que podemos fazer? Nesse caso, , então a probabilidade de logar torna-se
ou seja, é uma diminuição linear em . Portanto, o máximo deve ser para ! Porém, zero não é um valor válido para o parâmetro de taxa pois não corresponde a nenhuma distribuição exponencial. Devemos concluir que, neste caso, o estimador de probabilidade máxima não existe! Talvez alguém possa tentar construir algum tipo de intervalo de confiança parar=0
l(λ)=−nTλ
λλ=0λλcom base nessa função de probabilidade de log? Para isso, veja abaixo.
Mas, em qualquer caso, a conclusão real dos dados nesse caso é que devemos esperar mais tempo até obter alguns eventos ...
Aqui está como podemos construir um intervalo de confiança (unilateral) para , caso todas as observações sejam censuradas. A função de probabilidade nesse caso é , que tem a mesma forma que a função de probabilidade de um experimento binomial em que obtivemos todos os sucessos, que é (consulte também Intervalo de confiança em torno da estimativa binomial de 0 ou 1 ). Nesse caso, queremos um intervalo de confiança unilateral para no formato . Então, temos um intervalo para , resolvendo .e - λ n T p n p [ p ¯λe−λnTpnpλ log p = - λ T[p¯,1]λlogp=−λT
Obtemos o intervalo de confiança para resolvendo
para que . Finalmente, isso fornece o intervalo de confiança para :
P ( X = n ) = p n ≥ 0,95 (digamos) n log p ≥ log 0,95 λ λ ≤ - log 0,95p
P(X=n)=pn≥0.95 (say)
nlogp≥log0.95λλ≤−log0.95nT.