Medir com precisão a distância relativa entre um conjunto de fiduciais (aplicativo de realidade aumentada)

Digamos que eu tenho um conjunto de 5 marcadores. Estou tentando encontrar as distâncias relativas entre cada marcador usando uma estrutura de realidade aumentada, como o ARToolkit . Na minha câmera, você alimenta os primeiros 20 quadros, mostra-me os 2 primeiros marcadores apenas para que eu possa calcular a transformação entre os 2 marcadores. Os segundos 20 quadros mostram apenas o segundo e o terceiro marcadores e assim por diante. Os últimos 20 quadros mostram os marcadores 5 e 1. Quero construir um mapa 3D das posições dos marcadores dos 5 marcadores.

Minha pergunta é: sabendo que haverá imprecisões nas distâncias devido à baixa qualidade do feed de vídeo, como minimizo as imprecisões devido a todas as informações coletadas?

Minha abordagem ingênua seria usar o primeiro marcador como ponto base, desde os primeiros 20 quadros pegue a média das transformações e coloque o segundo marcador e assim por diante no terceiro e no quarto. Para o quinto marcador, coloque-o entre o 4º e o 1º, colocando-o no meio da média das transformações entre o 5º e o 1º e o 4º e 5º. Essa abordagem, na minha opinião, tem um viés em relação ao primeiro posicionamento do marcador e não leva em consideração a câmera vendo mais de 2 marcadores por quadro.

Por fim, quero que meu sistema seja capaz de elaborar o mapa do número x de marcadores. Em qualquer quadro, podem aparecer até x marcadores e há erros não sistêmicos devido à qualidade da imagem.

Qualquer ajuda sobre a abordagem correta para esse problema seria muito apreciada.

computer-vision augmented-reality

— Jkh2
fonte

1. A geometria / disposição dos marcadores é conhecida? 2. Você é capaz de estimar a matriz fundamental da câmera através de uma configuração de calibração?

— nav

Você pode usar a estrutura do algoritmo do tipo de movimento para estimar a pose da câmera no ambiente, e não nos marcadores, e depois fundir essa pose na câmera com as poses do marcador para detectar com precisão os locais dos marcadores. Conhecendo a pose extrínseca da sua câmera (por SFM), você pode triangular todas as posições 3D.

Para estimativa de pose, os métodos de 5 pontos são geralmente mais precisos que o algoritmo de 8 pontos.

Presumivelmente, você deve fazer mais ajustes no pacote para aumentar a precisão geral.

— Tolga Birdal
fonte