Pesquisei o banco de dados Redshift da Amazon como uma possível substituição futura para nosso data warehouse. Minha experiência sempre foi no uso da modelagem dimensional e dos métodos de Ralph Kimball, por isso foi um pouco estranho ver que o Redshift não suporta recursos como o tipo de dados serial para colunas de incremento automático.
No entanto, há uma postagem recente no blog da AWS Big Data sobre como otimizar o Redshift para um esquema em estrela: https://blogs.aws.amazon.com/bigdata/post/Tx1WZP38ERPGK5K/Optimizing-for-Star-Schemas - e - Intercalado - Classificação na Amazon - Redshift
A pergunta que tenho é sobre qual é a melhor prática para carregar um esquema em estrela no Redshift? Não consigo encontrar essa resposta em nenhuma documentação do Redshift.
Estou inclinado a importar meus arquivos do S3 para tabelas temporárias e, em seguida, usando o SQL para fazer transformações, como pesquisas e gerar chaves substitutas, antes de inseri-las nas tabelas de destino.
É isso que os outros estão fazendo atualmente? Existe uma ferramenta ETL que vale o dinheiro para facilitar isso?