Isso não está diretamente relacionado à minha outra pergunta , embora o tópico seja o mesmo. Também é provavelmente uma pergunta muito trivial, mas tenha paciência :) Eu estava discutindo com um colega sobre o uso da regressão de processo gaussiana, e ele fez duas afirmações com as quais não concordo:
- O GPR pode ser usado apenas para modelar uma resposta quando os preditores são normalmente distribuídos.
- a resposta de um modelo GPR é sempre normalmente distribuída.
Acredito que a primeira asserção é falsa (na verdade, o GPR não faz suposições sobre a distribuição conjunta dos preditores), enquanto a segunda só é verdadeira se os hiperparâmetros forem fixos. Entretanto, se seguirmos uma abordagem totalmente bayesiana e derivarmos a distribuição de probabilidade posterior dos hiperparâmetros, a distribuição preditiva posterior não será mais normalmente distribuída: é apenas a distribuição da resposta, condicionada aos hiperparâmetros e às observações , que é distribuído normalmente. Nas fórmulas:
e assuma um GP antes de . Deixei como um conjunto de observações, a distribuição de probabilidade posterior dos hiperparâmetros é
Agora, a distribuição de um novo vetor de resposta , condicional aos hiperparâmetros e às observações, ou seja, , é normalmente distribuído (certo?). Entretanto, a distribuição preditiva posterior é
Na integral, apenas o termo é um pdf normal (multivariado). e podem ter qualquer distribuição que considerarmos apropriada para modelar o problema estatístico em questão. Não há razão para pensar que o wrt integral do produto dessas três distribuições é normalmente distribuído, portanto, não podemos dizer que o vetor seja normalmente distribuído. Isso está correto?