Uma boa abordagem para esse tipo de problema pode ser encontrada na seção 4 do artigo The Bayesian Image Retrieval System, PicHunter por Cox et al (2000). Os dados são um conjunto de resultados inteiros que é o número de tentativas. No seu caso, existem 3 resultados possíveis por julgamento. Vou deixar ser o índice do rosto que foi deixado de fora. A idéia é postular um modelo generativo para o resultado, com base em alguns parâmetros do modelo, e depois estimar os parâmetros por probabilidade máxima. Se mostrarmos rostos e o participante disser que são os mais semelhantes, o resultado será , com probabilidade
N A i ( X 1 , X 2 , X 3 ) ( X 2 , X 3 ) A = 1 p ( A = 1 | X 1 , X 2 , X 3 ) ∝ exp ( - d ( X 2 , X 3 ) / σUMA1, . . . , ANNUMAEu(X1,X2,X3)(X2,X3)A=1d
p(A=1 | X1,X2,X3)∝exp(−d(X2,X3)/σ)
que é a distância entre as faces 2 e 3 e é um parâmetro para a quantidade de "ruído" (ou seja, quão consistentes são os participantes). Como você deseja incorporar no espaço euclidiano, sua medida de distância seria:
onde é (desconhecido) ) incorporação da face . Os parâmetros deste modelo são e , que você pode estimar a partir dos dados via probabilidade máxima. O artigo usou subida gradiente para encontrar o máximo.
σ d ( x , y ) = √d(X2,X3)σθxxθσd(x,y)=∑k(θxk−θyk)2−−−−−−−−−−−−√
θxxθσ
O modelo no artigo era um pouco diferente, pois usava atributos conhecidos das imagens para calcular a distância, em vez de uma incorporação desconhecida. Para aprender uma incorporação, você precisaria de um conjunto de dados muito maior, no qual cada face fosse mostrada várias vezes.
Este modelo básico assume que todos os ensaios são independentes e todos os participantes são iguais. Um bom benefício dessa abordagem é que você pode facilmente embelezar o modelo para incluir não independência, efeitos dos participantes ou outras covariáveis.