Digamos que eu tenho um conjunto de 5 marcadores. Estou tentando encontrar as distâncias relativas entre cada marcador usando uma estrutura de realidade aumentada, como o ARToolkit . Na minha câmera, você alimenta os primeiros 20 quadros, mostra-me os 2 primeiros marcadores apenas para que eu possa calcular a transformação entre os 2 marcadores. Os segundos 20 quadros mostram apenas o segundo e o terceiro marcadores e assim por diante. Os últimos 20 quadros mostram os marcadores 5 e 1. Quero construir um mapa 3D das posições dos marcadores dos 5 marcadores.
Minha pergunta é: sabendo que haverá imprecisões nas distâncias devido à baixa qualidade do feed de vídeo, como minimizo as imprecisões devido a todas as informações coletadas?
Minha abordagem ingênua seria usar o primeiro marcador como ponto base, desde os primeiros 20 quadros pegue a média das transformações e coloque o segundo marcador e assim por diante no terceiro e no quarto. Para o quinto marcador, coloque-o entre o 4º e o 1º, colocando-o no meio da média das transformações entre o 5º e o 1º e o 4º e 5º. Essa abordagem, na minha opinião, tem um viés em relação ao primeiro posicionamento do marcador e não leva em consideração a câmera vendo mais de 2 marcadores por quadro.
Por fim, quero que meu sistema seja capaz de elaborar o mapa do número x de marcadores. Em qualquer quadro, podem aparecer até x marcadores e há erros não sistêmicos devido à qualidade da imagem.
Qualquer ajuda sobre a abordagem correta para esse problema seria muito apreciada.