Eu acho que você não entende o que é um marco. É um termo genérico e abrangente para qualquer coisa que um robô possa reconhecer e usar como parte de um mapa. Em particular, "pontos de referência" são importantes para algoritmos SLAM baseados em recursos, como slam baseado em EKF. O que você usa para "pontos de referência" depende de quais sensores estão disponíveis para o robô.
No seu caso, como você não especificou nenhum sensor, assumiremos que o robô sabe quando atinge um objeto. Então, qualquer "marco" é simplesmente sempre que o robô esbarra em algo. Se você fizer isso com caneta e papel, você apenas passeará e colocará um X sempre que bater em algo, depois vire e continue andando. À medida que o tempo chega ao infinito, você tem um mapa razoável de onde estão os limites dos objetos e quais são as formas dos objetos, desde que tudo seja estático.
Nesse caso, o "mapa" pode ser apenas um bitmap, onde cada pixel é 0 ou 1, dependendo se ele tem um objeto nesse espaço ou não. A escala depende do aplicativo.
Sugiro fazer um pouco mais de pesquisa sobre esses tópicos:
- Representação da grade de ocupação
- Mapeamento baseado em recursos