Minha formação é principalmente em aprendizado de máquina e eu estava tentando aprender o que significava o teste de Hipótese Bayesiana. Eu estou bem com a interpretação bayesiana da probabilidade e estou familiarizada com ela no contexto de modelos gráficos probabilísticos. No entanto, o que está me confundindo é o que a palavra "Hipótese" significa no contexto da inferência estatística.
Acho que estou me confundindo principalmente com o vocabulário com o qual estou acostumado no aprendizado de máquina versus o que é normalmente usado em estatística e inferência.
No contexto da aprendizagem supervisionada , eu normalmente pensar na hipótese de que a função preditiva que mapeia exemplos para seus rótulos ou seja . No entanto, parece-me que o termo hipótese, nas leituras que estou fazendo, não tem o mesmo significado. Deixe-me colar um extrato das leituras que estou lendo:
Se você ler atentamente, também diz:
existe um modelo diferente para os dados observados ...
eles usaram a palavra modelo. Para mim, o modelo da palavra me faz pensar em um conjunto de funções onde selecionamos uma função preditiva específica. isto é, uma classe de hipótese de função. Por exemplo, poderia ser a classe hipótese de funções quadráticas (polinomial de grau 2). No entanto, parece-me que eles usam a palavra modelo e hipótese como sinônimo neste extrato (onde para mim são palavras completamente diferentes).
Em seguida, menciona que podemos colocar anteriores à hipótese (algo completamente razoável a ser feito em um cenário bayesiano):
também podemos caracterizar os dados com uma hipótese atual:
e atualize nossas crenças atuais, dados alguns dados (e regra de Baye):
No entanto, acho que estou mais acostumado a colocar uma estimativa bayesiana em um parâmetro específico (digamos, ) de uma classe de hipótese em vez de em toda a classe de hipótese. Basicamente, como parece que essas "hipóteses" não são as mesmas hipóteses do contexto de aprendizado de máquina com as quais estou acostumado, parece-me que essas hipóteses são mais semelhantes a um parâmetro θ específico do que a uma classe de hipóteses.
Nesse ponto, eu estava convencido de que "hipótese" significava o mesmo que na função preditiva (parametrizada por um parâmetro , por exemplo), mas acho que estava errado ...
Para piorar ainda mais minha confusão, mais tarde essas mesmas leituras foram adiante para especificar uma "hipótese" específica para cada exemplo de treinamento que eles observaram. Deixe-me colar um extrato do que quero dizer:
a razão pela qual isso me confunde é que, se eu interpretar a hipótese como um parâmetro, para mim não faz sentido especificar um parâmetro específico para cada valor de amostra que vemos. Nesse ponto, concluí que realmente não sabia o que eles queriam dizer com hipótese, por isso postei essa pergunta.
No entanto, não desisti completamente, pesquisei o que significa hipótese nas estatísticas freqüentistas e encontrei o seguinte vídeo da academia khan . Esse vídeo realmente faz muito sentido para mim (talvez você seja um frequentista! :) . No entanto, parece que eles obtêm um monte de dados (como alguns "conjuntos de amostras") e, com base nas propriedades do conjunto de amostras, decidem se aceitam ou rejeitam a hipótese nula sobre os dados. No entanto, no contexto bayesiano que estou lendo, parece-me que, para cada vetor de [ponto] de dados observado, eles "o rotulam" com uma hipótese com o "teste de razão de verossimilhança":
A maneira como eles atribuem hipóteses a cada amostra de dados parece até um ambiente de aprendizado supervisionado, quando anexamos um rótulo a cada conjunto de treinamento. No entanto, acho que não é isso que eles estão fazendo neste contexto. O que eles estão fazendo? O que significa atribuir uma hipótese a cada amostra de dados? Qual é o significado de uma hipótese? O que significa o modelo de palavra?
Basicamente, após essa longa explicação da minha confusão, alguém sabe o que significa o teste de hipóteses bayesianas nesse contexto?
Se você precisar de algum esclarecimento ou algo para melhorar minha pergunta ou para que a pergunta faça sentido, fico feliz em ajudar :)
Na minha busca por uma resposta, encontrei algumas coisas úteis relacionadas ao teste estatístico de hipóteses:
Este aborda uma boa introdução ao tópico, se você tem experiência em CS (como eu):
O que é uma boa introdução ao teste de hipóteses estatísticas para cientistas da computação?
Em algum momento, perguntei sobre "parâmetros padrão" (que eu deveria ter definido o que eu quis dizer. Eu pensei que era um termo padrão, mas não é, então aqui vou abordá-lo) e acho que o que realmente queria dizer é como fazer você especifica parâmetros para cada hipótese que você possui. Por exemplo, como você decide qual é sua hipótese nula e seus parâmetros. Há uma pergunta relacionada a isso: