Estou tentando "combinar" pequenas manchas quadradas em uma imagem. À primeira vista, parece razoável simplesmente fazer uma comparação no estilo da distância euclidiana de duas dessas matrizes para obter uma medida de "similaridade". Isso funciona bem em muitos casos (o "melhor" patch (valor mais baixo) de acordo com essa métrica se parece muito com o patch de consulta. No entanto, há muitos casos em que isso produz uma correspondência muito ruim. Por exemplo, considere estes dois pares de patches:
Dois remendos de uma parede de tijolos, pontuação 134 (esta é a soma dos componentes da diferença média absoluta de pixels):
Um pedaço de uma parede de tijolos, um pedaço de grama, marca 123!
Para um humano, "claramente" a grama não corresponde ao tijolo, mas essa métrica diz o contrário. O problema está apenas na variação estatística local.
Se eu usar algo como uma comparação de histograma, perco completamente todas as informações espaciais - por exemplo, se um remendo é grama na parte superior e tijolo na parte inferior, ele corresponderia exatamente a um remendo com grama na parte inferior e tijolo na parte superior (novamente , outra correspondência "obviamente errada").
Existe uma métrica que de alguma forma combine essas duas idéias em um valor razoável que será avaliado como "semelhante" para o par 1 acima, mas também não seja semelhante no meu exemplo de patch e seu espelho vertical?
Todas as sugestões são apreciadas!