O método MLE pode ser aplicado nos casos em que alguém conhece a forma funcional básica do pdf (por exemplo, é Gaussian, ou log-normal, ou exponencial, ou o que for), mas não os parâmetros subjacentes; por exemplo, eles não sabem os valores de e σ no pdf: f ( x | μ , σ ) = 1μσ ou qualquer outro tipo de pdf que eles estejam assumindo. O emprego do método de MLE é escolher os melhores valores (ou seja, mais plausíveis) para os parâmetros desconhecidos, tendo em conta as medições de dados particularesx1,x2,x3,. . .
f(x|μ,σ)=12πσ2−−−−√exp[−(x−μ)22σ2]
x1,x2,x3,...que foram realmente observados. Portanto, para responder à sua primeira pergunta, sim, você sempre tem o direito de perguntar a alguém que
formato de pdf ela está assumindo para obter a estimativa de probabilidade máxima; de fato, os valores estimados dos parâmetros que eles informam não são significativos, a menos que primeiro comuniquem esse contexto.
O algoritmo EM, como já o vi aplicado no passado, é mais um tipo de meta-algoritmo, em que alguns dos metadados estão ausentes, e você precisa estimar isso também. Assim, por exemplo, talvez ter uma PDF, que é uma mistura de vários Gaussianas, por exemplo:
f(x|A1,...,AN,μ1,...,μN,σ1,...σN)=∑k=1NAk2πσ2k−−−−√exp[−(x−μk)22σ2k]
AkNx1,x2,x3,...
NN=1A1μ1σ1N=2A1, A2, μ1, μ2, σ1, σ2). The best fit values that you obtain for (A1, μ1, σ1) in the N=1 model can't directly be compared to the best fit values that you obtain for those same parameters in the N=2 model, because they are different models with a different number of degrees of freedom.
The role of the EM algorithm is to provide a mechanism for making those types of comparisons (usually by imposing a "complexity penalty" that prefers smaller values of N) so that we can choose the best overall value for N.
So, to answer your original question, the EM algorithm requires a less precise specification of the form of the pdf; one might say that it considers a range of alternative options (e.g., the option where N=1, N=2, N=3, etc.) but it still requires you to specify something about the basic mathematical form of those options--you still have to specify a "family" of possible pdfs, in some sense, even though you are letting the algorithm decide for you which "member" of the family provides the best fit to the data.