"O que faz o estimador funcionar quando a distribuição de erro real não corresponde à distribuição de erro assumida?"
Em princípio, o QMPLE não "funciona", no sentido de ser um estimador "bom". A teoria desenvolvida em torno do QMLE é útil porque levou a testes de especificação incorreta.
O que o QMLE certamente faz é estimar consistentemente o vetor de parâmetro que minimiza a divergência Kullback-Leiber entre a distribuição verdadeira e a especificada. Parece bom, mas minimizar essa distância não significa que a distância minimizada não será enorme.
Ainda assim, lemos que há muitas situações em que o QMLE é um estimador consistente para o verdadeiro vetor de parâmetros. Isso deve ser avaliado caso a caso, mas deixe-me dar uma situação muito geral, que mostra que não há nada inerente ao QMLE que o torne consistente para o verdadeiro vetor ...
... Pelo contrário, é o fato de coincidir com outro estimador que é sempre consistente (mantendo a premissa de amostra ergódica-estacionária): o antiquado, estimador do Método dos Momentos.
Em outras palavras, quando em dúvida sobre a distribuição, uma estratégia a considerar é "sempre especifique uma distribuição para a qual o estimador de Máxima Verossimilhança para os parâmetros de interesse coincida com o estimador do Método dos Momentos" : dessa maneira, não importa o quanto esteja errado é sua suposição distributiva, o estimador será pelo menos consistente.
Você pode levar essa estratégia a extremos ridículos: suponha que você tenha uma amostra de ID muito grande de uma variável aleatória, na qual todos os valores são positivos. Continue e assuma que a variável aleatória é normalmente distribuída e aplique a máxima probabilidade para a média e a variação: seu QMLE será consistente para os valores reais.
É claro que isso levanta a questão: por que pretender aplicar o MLE, já que o que estamos fazendo essencialmente é confiar e se esconder por trás dos pontos fortes do Método dos Momentos (que também garante a normalidade assintótica)?
Em outros casos mais refinados, o QMLE pode ser consistente com os parâmetros de interesse se pudermos dizer que especificamos corretamente a função média condicional, mas não a distribuição (este é o caso do Pooled Poisson QMLE - consulte Wooldridge). .