O modelo subjacente do PLS é que um dado vetor e vetor são relacionados por onde é uma matriz latente , e são termos de ruído (as operações estão centralizadas).X n y X = T P ′ + E , y = T q ′ + f , T n × k E , f X , y
O PLS produz estimativas de e um vetor 'atalho' de coeficientes de regressão, modo que . Gostaria de encontrar a distribuição de sob algumas suposições simplificadoras, que provavelmente devem incluir o seguinte:β y ~ X β β
- O modelo está correto, ou seja , para desconhecido ;T , P , q
- O número de fatores latentes, , é conhecido e usado no algoritmo PLS;
- Os termos de erro reais são normais zero-mean normal com variações conhecidas;
Essa pergunta é um pouco sub-definida, porque existem dezenas de variantes do algoritmo 'the' PLS, mas eu aceitaria resultados para qualquer uma delas. Eu também aceitaria orientações sobre como estimar a distribuição de através, por exemplo, de um bootstrap, mas talvez essa seja uma pergunta separada.