Estou lendo sobre a arquitetura lambda.
Faz sentido. temos ingestão de dados baseada em fila. temos um armazenamento na memória para dados que é muito novo e temos HDFS para dados antigos.
Portanto, temos todo o nosso conjunto de dados. no nosso sistema. muito bom.
mas o diagrama da arquitetura mostra que a camada de mesclagem é capaz de consultar a camada de lote e a camada de velocidade de uma só vez.
Como fazer isso?
Sua camada de lote é provavelmente um trabalho de redução de mapa ou uma consulta HIVE. A consulta da camada de velocidade é provavelmente um programa scala que está sendo executado na faísca.
Agora, como você irá mesclar isso?
Existe alguma orientação?