Bayesiano: "Olá, aprendiz de máquina!"
Frequentist: "Olá, aprendiz de máquina!"
Machine Learning: "Ouvi dizer que vocês são bons em coisas. Aqui estão alguns dados."
F: "Sim, vamos escrever um modelo e depois calcular o MLE."
B: "Ei, F, não foi isso que você me disse ontem! Eu tinha alguns dados univariados e queria estimar a variância, e calculei o MLE. Então você atacou e me disse para dividir por vez de por nn - 1n . "
F: "Ah, sim, obrigado por me lembrar. Costumo pensar que devo usar o MLE para tudo, mas estou interessado em estimadores imparciais e assim por diante".
ML: "Eh, sobre o que é isso filosofar? Isso vai me ajudar?"
F: "OK, um estimador é uma caixa preta, você coloca dados e fornece alguns números. Nós, freqüentadores, não ligamos para como a caixa foi construída, sobre quais princípios foram usados para projetá-la. Por exemplo, eu não sabe como derivar a regra . "÷ ( n - 1 )
ML: "Então, com o que você se importa?"
F: "Avaliação".
ML: "Eu gosto do som disso."
F: "Uma caixa preta é uma caixa preta. Se alguém afirma que um determinado estimador é um estimador imparcial para , então tentamos muitos valores de θ por sua vez, geramos muitas amostras de cada um com base em algum modelo assumido, pressionando-os pelo estimador , e encontre a média estimada θ . Se pudermos provar que a estimativa esperada é igual ao valor verdadeiro, para todos os valores, então dizemos que é imparcial ".θθθ
ML: "Parece ótimo! Parece que os freqüentadores são pessoas pragmáticas. Você julga cada caixa preta por seus resultados. A avaliação é fundamental."
F: "De fato! Entendo que vocês adotam uma abordagem semelhante. Validação cruzada, ou algo assim? Mas isso me parece confuso".
ML: "Desarrumado?"
F: "A idéia de testar seu estimador em dados reais parece perigosa para mim. Os dados empíricos que você usa podem ter todos os tipos de problemas com eles e podem não se comportar de acordo com o modelo que combinamos para a avaliação".
ML: "O quê? Pensei que você tivesse provado alguns resultados? Que seu estimador seria sempre imparcial, para todos os ".θ
F: "Sim. Embora seu método possa ter funcionado em um conjunto de dados (o conjunto de dados com dados de treinamento e teste) que você usou em sua avaliação, posso provar que o meu sempre funcionará."
ML: "Para todos os conjuntos de dados?"
F: "Não"
ML: "Então, meu método foi validado cruzadamente em um conjunto de dados. Você não testou o seu em nenhum conjunto de dados real?"
F: "Está certo."
ML: "Isso me coloca na liderança então! Meu método é melhor que o seu. Ele prevê câncer 90% das vezes. Sua 'prova' é válida apenas se todo o conjunto de dados se comportar de acordo com o modelo que você assumiu."
F: "Emm, sim, eu suponho."
ML: "E esse intervalo tem cobertura de 95% . Mas não me surpreenderia se ele contiver apenas o valor correto de 20% do tempo?"θ
F: "Está certo. A menos que os dados sejam realmente normais (ou seja o que for), minha prova é inútil."
ML: "Portanto, minha avaliação é mais confiável e abrangente? Ela funciona apenas nos conjuntos de dados que eu tentei até agora, mas pelo menos são conjuntos de dados reais, verrugas e tudo mais. Lá estava você, tentando afirmar que era mais 'conservador 'e' completo 'e que você estava interessado em verificar modelos e outras coisas ".
B: (interrompe) "Ei pessoal, desculpe interromper. Eu adoraria intervir e equilibrar as coisas, talvez demonstrando alguns outros problemas, mas eu realmente amo assistir meu colega freqüentador se contorcer."
F: "Uau!"
ML: "OK, crianças. Era tudo uma questão de avaliação. Um estimador é uma caixa preta. Os dados entram, os dados saem. Aprovamos ou desaprovamos um estimador com base no desempenho em avaliação. Não nos importamos sobre as 'receitas' ou 'princípios de design' usados ".
F: "Sim. Mas temos idéias muito diferentes sobre quais avaliações são importantes. O ML fará treinamento e teste em dados reais. Considerando que eu farei uma avaliação que é mais geral (porque envolve uma prova amplamente aplicável) e também mais limitado (porque não sei se o seu conjunto de dados é realmente extraído das suposições de modelagem que utilizo ao projetar minha avaliação.) "
ML: "Que avaliação você usa, B?"
F: (interrompe) "Ei. Não me faça rir. Ele não avalia nada. Ele apenas usa suas crenças subjetivas e segue em frente. Ou algo assim."
B: "Essa é a interpretação comum. Mas também é possível definir o bayesianismo pelas avaliações preferidas. Então, podemos usar a ideia de que nenhum de nós se importa com o que está na caixa preta, mas apenas com maneiras diferentes de avaliar".
B continua: "Exemplo clássico: exame médico. O resultado do exame de sangue é positivo ou negativo. Um freqüentador estará interessado, nas pessoas saudáveis, em que proporção obtém um resultado negativo. E, similarmente, em que proporção de pessoas doentes haverá obtenha um positivo. O frequentista irá calculá-los para cada método de exame de sangue que está sendo considerado e, em seguida, recomendar que utilizemos o teste que obteve a melhor pontuação. "
F: "Exatamente. O que mais você poderia querer?"
B: "E aqueles indivíduos que obtiveram um resultado positivo no teste? Eles vão querer saber 'daqueles que obtiveram um resultado positivo, quantos ficarão doentes?' e 'daqueles que obtêm um resultado negativo, quantos são saudáveis?' "
ML: "Ah, sim, isso parece um melhor par de perguntas a fazer."
F: "HERESIA!"
B: "Aqui vamos nós novamente. Ele não gosta de onde isso está indo."
ML: "Isso é sobre 'priors', não é?"
F: "MAL".
B: "De qualquer forma, sim, você está certo. ML. Para calcular a proporção de pessoas com resultado positivo doentes, você deve fazer uma de duas coisas. Uma opção é executar os testes em muitas pessoas e apenas observar o proporções relevantes. Quantas dessas pessoas morrem da doença, por exemplo ".
ML: "Parece o que eu faço. Use treinar e testar."
B: "Mas você pode calcular esses números antecipadamente, se estiver disposto a fazer uma suposição sobre a taxa de doença na população. O freqüentador também faz seus cálculos com antecedência, mas sem usar essa taxa de doença no nível da população".
F: "Mais suposições sem fundamento".
B: "Ah, cale a boca. Anteriormente, você foi descoberto. ML descobriu que gosta tanto de suposições infundadas quanto qualquer outra pessoa. Suas probabilidades de cobertura" comprovadas "não se acumularão no mundo real, a menos que todas as suas suposições se sustentem. Por que minha suposição anterior é tão diferente? Você me chama de louco, mas finge que suas suposições são o trabalho de uma análise conservadora, sólida e isenta de suposições ".
B (continua): "De qualquer forma, ML, como eu estava dizendo. Os bayesianos gostam de um tipo diferente de avaliação. Estamos mais interessados em condicionar os dados observados e em calcular a precisão de nosso estimador de acordo. Não podemos realizar essa avaliação sem usar Mas o interessante é que, uma vez que decidimos sobre essa forma de avaliação e uma vez escolhida a nossa prévia, temos uma 'receita' automática para criar um estimador apropriado. O frequentista não tem essa receita. estimador imparcial para um modelo complexo, ele não tem nenhuma maneira automatizada de construir um estimador adequado ".
ML: "E você faz? Você pode criar automaticamente um estimador?"
B: "Sim. Eu não tenho uma maneira automática de criar um estimador imparcial, porque acho que o viés é uma maneira ruim de avaliar um estimador. Mas, dada a estimativa de dados condicionais que eu gosto, e a anterior, eu pode conectar o anterior e a probabilidade de me fornecer o estimador ".
ML: "De qualquer forma, vamos recapitular. Todos temos maneiras diferentes de avaliar nossos métodos, e provavelmente nunca concordaremos sobre quais são os melhores."
B: "Bem, isso não é justo. Poderíamos misturá-los e combiná-los. Se algum de nós tiver bons dados de treinamento rotulados, provavelmente devemos testá-lo. E geralmente todos devemos testar o máximo de suposições que pudermos. E alguns 'freqüentadores 'provas também podem ser divertidas, prevendo o desempenho em algum modelo de geração de dados presumido ".
F: "Sim, pessoal. Vamos ser pragmáticos em relação à avaliação. E, na verdade, vou parar de ficar obcecado com as propriedades de amostras infinitas. Estou pedindo aos cientistas que me forneçam uma amostra infinita, mas eles ainda não o fizeram. hora de me concentrar novamente em amostras finitas ".
ML: "Então, temos apenas uma última pergunta. Discutimos muito sobre como avaliar nossos métodos, mas como criamos nossos métodos".
B: "Ah. Como eu estava começando, nós Bayesianos temos o método geral mais poderoso. Pode ser complicado, mas sempre podemos escrever algum tipo de algoritmo (talvez uma forma ingênua de MCMC) que será amostrado em nosso posterior. "
F (interpõe): "Mas pode ter um viés".
B: "Seus métodos também podem. Preciso lembrá-lo de que o MLE é frequentemente tendencioso? Às vezes, você tem uma grande dificuldade em encontrar estimadores imparciais, e mesmo quando possui um estimador estúpido (para algum modelo realmente complexo) que diz o a variação é negativa. E você chama isso de imparcial. Imparcial, sim. Mas útil, não! "
ML: "OK pessoal. Você está reclamando novamente. Deixe-me fazer uma pergunta, F. Você já comparou o viés do seu método com o viés do método de B, quando vocês dois trabalharam no mesmo problema?"
F: "Sim. Na verdade, eu odeio admitir isso, mas a abordagem de B às vezes tem um viés e um MSE mais baixos do que meu estimador!"
ML: "A lição aqui é que, embora discordemos um pouco da avaliação, nenhum de nós tem o monopólio de como criar um estimador que possui propriedades que queremos".
B: "Sim, devemos ler um pouco mais o trabalho um do outro. Podemos nos inspirar para os estimadores. Podemos achar que os estimadores dos outros funcionam muito bem, prontos para uso, em nossos próprios problemas".
F: "E devo parar de ficar obcecado com o viés. Um estimador imparcial pode ter uma variação ridícula. Suponho que todos nós temos que" assumir a responsabilidade "pelas escolhas que fazemos na forma como avaliamos e pelas propriedades que desejamos ver em nossos avaliadores. Não podemos ficar atrás de uma filosofia. Tente todas as avaliações que puder. E continuarei dando uma olhada na literatura bayesiana para obter novas idéias para os estimadores! "
B: "De fato, muitas pessoas realmente não sabem qual é a sua própria filosofia. Eu nem tenho certeza. Se eu usar uma receita bayesiana e depois provar algum bom resultado teórico, isso não significa que eu Um frequentista se preocupa com as provas acima sobre desempenho, ele não se importa com receitas.E se eu fizer algum treinamento e teste (ou também), isso significa que eu sou aprendiz de máquina? "
ML: "Parece que somos todos muito parecidos então."