O que você descreve necessidades de tratamento especial, não é o que costumamos dizer com "variáveis aleatórias truncados" -e o que costumamos dizer é que a variável aleatória que não variam fora do suporte truncado, o que significa que há não uma concentração de massa de probabilidade de o ponto de truncamento. Para contrastar casos:
A) Significado "usual" de um rv truncado
Para qualquer distribuição que truncarmos seu suporte, devemos "corrigir" sua densidade para que ela se integre à unidade quando integrada sobre o suporte truncado. Se a variável tiver suporte em , , então (pdf , cdf )- ∞ < a < b < ∞ f F[a,b]−∞<a<b<∞fF
∫bafX(x)dx=∫MafX(x)dx+∫bMfX(x)dx=∫MafX(x)dx+[1−FX(M)]=1
⇒∫MafX(x)dx=FX(M)
Como o LHS é parte integrante do suporte truncado, vemos que a densidade do rv truncado, chamado , deve serX~
[ a , M ] n n
fX~(x~)=fX(x∣X≤M)=fX(x)dx⋅[FX(M)]−1
para que integra-se à unidade sobre . O termo do meio na expressão acima nos faz pensar nessa situação (com razão) como uma forma de
condicionamento - mas não em outra variável aleatória, mas nos possíveis valores que o próprio RV pode assumir. Aqui, a função densidade / probabilidade conjunta de uma coleção de IDI truncados seria vezes a densidade acima, como de costume.
[a,M]nn
B) Concentração de massa de probabilidade
Aqui, que é o que você descreve na pergunta, as coisas são diferentes. O ponto concentra toda a massa de probabilidade que corresponde ao suporte da variável mais elevada do que . Isso cria um ponto de descontinuidade na densidade e faz com que ela tenha dois ramosMM M
fX∗(x∗)fX∗(x∗)=fX(x∗)x∗<M=P(X∗≥M)x∗≥M
Informalmente, o segundo é "como um rv discreto", em que cada ponto na função de massa de probabilidade representa probabilidades reais. Agora, suponha que não possuamos tais variáveis aleatórias e queremos formar sua função de densidade / probabilidade conjunta. Antes de analisar a amostra real, qual ramo devemos escolher? Não podemos tomar essa decisão, por isso temos que, de alguma forma, incluir as duas. Para fazer isso, precisamos usar funções indicadoras: denotar a função indicadora que assume o valor quando e caso contrário. A densidade de tal rv pode ser escritaI { x * ≥ H } ≡ I ≥ M ( X * ) 1 x * ≥ H 0nI{x∗≥M}≡I≥M(x∗)1x∗≥M0
n
fX∗(x∗)=fX(x∗)⋅[1−I≥M(x∗)]+P(X∗≥M)⋅I≥M(x∗)
e, portanto, a função de densidade conjunta de tais variáveis iid é
n
fX∗(X∗∣θ)=∏i=1n[fX(x∗i)⋅[1−I≥M(x∗i)]+P(X∗i≥M)⋅I≥M(x∗i)]
Agora, o exposto acima como uma função de probabilidade, a amostra real consistindo em realizações dessas variáveis aleatórias entra em jogo. E nesta amostra, algumas realizações observadas serão inferiores ao limiar , outras iguais. Denotam o número de realizações da amostra que é igual a , e tudo o resto, . É imediato que, para as realizações, a parte correspondente da densidade que permanecerá na probabilidade seja a parte , enquanto para as realizações, a outra parte. EntãonMmMvm+v=nmP(X∗i≥M)v
L(θ∣{x∗i;i=1,...n})=∏i=1v[fX(x∗i)]⋅∏j=1m[P(X∗j≥M)]=∏i=1v[fX(x∗i)]⋅[P(X∗≥M)]m