Você aplica uma definição relativamente restrita de frequentismo e MLE - se formos um pouco mais generosos e definirmos
Frequentismo: objetivo de consistência, otimização (assintótica), imparcialidade e taxas de erro controladas sob amostragem repetida, independentemente dos parâmetros verdadeiros
MLE = estimativa pontual + intervalos de confiança (ICs)
parece claro que o MLE satisfaz todos os ideais freqüentistas. Em particular, os ICs no MLE, como valores-p, controlam a taxa de erro em amostragens repetidas e não fornecem a região de probabilidade de 95% para o verdadeiro valor do parâmetro, como muitas pessoas pensam - portanto, eles são frequentes e freqüentes.
Nem todas essas idéias já estavam presentes no artigo fundador de Fisher de 1922, "Sobre os fundamentos matemáticos da estatística teórica" , mas a idéia de otimalidade e imparcialidade é, e Neyman posteriormente acrescentou a idéia de construir ICs com taxas de erro fixas. Efron, 2013, "Um argumento de 250 anos: Crença, comportamento e autoinicialização" , resume em sua história muito legível do debate bayesiano / freqüentista:
O movimento freqüentador realmente começou a rolar no início dos anos 1900. Ronald Fisher desenvolveu a teoria da máxima verossimilhança da estimativa ótima, mostrando o melhor comportamento possível para uma estimativa, e Jerzy Neyman fez o mesmo para intervalos e testes de confiança. Os procedimentos de Fisher e Neyman se encaixavam quase perfeitamente nas necessidades científicas e nos limites computacionais da ciência do século XX, lançando o bayesianismo em uma existência sombria.
Em relação à sua definição mais restrita - discordo levemente da sua premissa de que a minimização do risco freqüentista (FR) é o principal critério para decidir se um método segue a filosofia freqüentista. Eu diria que o fato de minimizar a FR é uma propriedade desejável segue a filosofia freqüentista, ao invés de precedê-la. Portanto, uma regra de decisão / estimador não precisa minimizar o FR para ser freqüentista, e minimizar o FR também não significa necessariamente que um método seja freqüentista, mas um freqüentador em dúvida preferiria minimizar a FR.
Se olharmos especificamente para o MLE: Fisher mostrou que o MLE é assintoticamente ideal (amplamente equivalente à minimização de FR), e essa foi certamente uma razão para promover o MLE. No entanto, ele sabia que a otimização não se aplicava ao tamanho finito da amostra. Ainda assim, ele ficou satisfeito com esse estimador devido a outras propriedades desejáveis, como consistência, normalidade assintótica, invariância sob transformações de parâmetros, e não vamos esquecer: facilidade de calcular. A invariância, em particular, é enfatizada abundantemente no artigo de 1922 - pela minha leitura, eu diria que manter a invariância sob a transformação de parâmetros e a capacidade de se livrar dos anteriores em geral foram uma das principais motivações na escolha do MLE. Se você quer entender melhor o raciocínio dele, eu realmente recomendo o artigo de 1922,