Você obterá uma resposta muito melhor se fornecer mais alguns detalhes técnicos sobre que tipo de dados você está tentando colocar sob controle de versão, como deseja armazenar versões diferentes dos dados, quais componentes provavelmente serão alterados e quais componentes não são e se você realmente terá um histórico semelhante a uma árvore (ramificações, mesclagens).
Os arquivos HDF5 não são adequados para o controle de versão baseado em diff no git.
O git usa um banco de dados baseado em hash sob o capô, portanto, é possível armazenar o hash do seu arquivo de dados HDF5 sem realmente armazenar o próprio arquivo. Três projetos, git-fat , git-anexo e git-media , simplificam bastante esse processo para você. Eu sugeriria usar essa abordagem se você tiver grandes e completamente independentes pedaços de dados que gostaria de versão explicitamente.
Se você pode separar seu armazenamento de dados em regiões não voláteis e voláteis, isso melhorará bastante a eficiência de sua interação com o banco de dados de controle de versão. Você também pode considerar o uso explícito de um banco de dados para seus dados, se não precisar dos recursos DVCS que o git oferece.