Um problema na visão computacional e na reconstrução 3d está recebendo os parâmetros intrínsecos da câmera. Uma solução comum é usar um objeto em que se saiba as medidas da forma antes da mão, como um tabuleiro de damas. O problema desse método é que ele deve ser feito sempre que o parâmetro da câmera for alterado, como distância focal e ampliação.
Estou tentando implementar a auto-calibração da câmera discutida em Uma técnica simples para auto-calibração . A matriz essencial é restringida por seus dois valores singulares. Isso pode ser usado para recuperar os intrínsecos da câmera sem fazer uma calibração manual (ou seja, com um tabuleiro de damas). Estou um pouco confuso com a forma como a função de custo pode ser minimizada. Aqui está o que eu entendo até agora:
matriz essencial
matriz intrínseca
- produto da distância focal e fator de ampliação [resolver]
- relação de aspecto [suponha fornecido, eu acho da câmera ou dados EXIF?]
- são as coordenadas do ponto principal [assuma 0, 0]
- inclinação [assumir 0]
função de custo
Pergunta: Como essa função de custo está sendo minimizada?