O formulário fechado não existe para T, mas uma abordagem muito intuitiva e estável é através do algoritmo EM. Agora, como o aluno é uma mistura em escala de normais, você pode escrever seu modelo como
yEu= μ + eEu
onde e . Isso significa que, condicionalmente, em a são apenas a média ponderada e o desvio padrão. Este é o passo "M"w i ∼ G a ( νeEu| σ, wEu∼ N( 0 , σ2W- 1Eu)wiWEu∼ G a ( ν2, ν2)WEu
σ 2=Σiwi(yi - μ )2
μ^= ∑EuWEuyEu∑EuWEu
σ^2= ∑EuWEu( yEu- μ^)2n
Agora, a etapa "E" substitui por sua expectativa, considerando todos os dados. Isto é dado como:WEu
W^Eu= ( ν+ 1 ) σ2νσ2+ ( yEu- μ )2
para simplesmente iterar as duas etapas acima, substituindo o "lado direito" de cada equação pelas estimativas de parâmetros atuais.
Isso mostra muito facilmente as propriedades de robustez da distribuição t, pois as observações com grandes resíduos recebem menos peso no cálculo da localização e influência limitada no cálculo de . Por "influência limitada", quero dizer que a contribuição para a estimativa de da i-ésima observação não pode exceder um determinado limite (este é no algoritmo EM). Além disso, é um parâmetro de "robustez", pois aumentar (diminuir) resultará em pesos mais (menos) uniformes e, portanto, mais (menos) sensibilidade a valores discrepantes.σ 2 σ 2 ( ν + 1 ) σ 2 o l d ν νμσ2σ2( ν+ 1 ) σ2o l dνν
Uma coisa a ser observada é que a função de probabilidade de log pode ter mais de um ponto estacionário; portanto, o algoritmo EM pode convergir para um modo local em vez de global. É provável que os modos locais sejam encontrados quando o parâmetro location for iniciado muito perto de um outlier. Portanto, começar na mediana é uma boa maneira de evitar isso.