Sou estudante de mestrado, preparando um seminário em visão computacional. Entre os tópicos está o rastreador Kanade-Lucas-Tomasi (KLT), conforme descrito em
J. Shi, C. Tomasi, "Bons recursos para rastrear" . Processo CVPR '94.
Aqui está um recurso da Web que estou usando para entender o rastreador KLT. Preciso de ajuda com a matemática, pois estou um pouco enferrujado em álgebra linear e não tenho experiência anterior com visão computacional.
Nesta fórmula para (etapa 5 no resumo), observe o Hessiano inverso:
No artigo, boas características para rastrear são definidas como aquelas em que a soma das matrizes inversas de Hessian tem grandes valores próprios semelhantes: . Eu não conseguia entender como e de onde isso é derivado, matematicamente.
A intuição é que isso representa um canto; Entenda isso. O que isso tem a ver com autovalores? Espero que, se os valores do Hessian forem baixos, não haverá mudança e não haverá um canto. Se eles são altos, é um canto. Alguém sabe como a intuição da cornualidade entra em jogo nos autovalores do Hessiano inverso para determinar através de iterações do rastreador KLT?
Consegui encontrar recursos alegando que o Hessian inverso se correlaciona com a matriz de covariância da imagem. Além disso, a covariância da imagem indica a mudança de intensidade, e então faz sentido ... mas não consegui encontrar o que exatamente é uma matriz de covariância da imagem em relação a uma imagem, e não a um vetor ou a uma coleção de imagens.
Além disso, os autovalores têm significado na análise de componentes em princípio, e é por isso que recebo a ideia de uma matriz de covariância de imagens, mas não sei como aplicar isso ao Hessian, como geralmente é aplicado a uma imagem. O Hesse, tanto quanto eu entendo, é um matriz definindo as 2nd derivados de x , y , e x y em um determinado local ( x , y ) .
Eu realmente aprecio a ajuda com isso, já que estou nele há mais de 3 dias, é apenas uma fórmula pequena e o tempo está se esgotando.