Normalmente, um tópico importante no DevOps é como cuidamos da criação e entrega automatizadas de artefatos de software.
Com o surgimento da ciência de dados, existe um novo tipo de artefato - blobs binários monolíticos que representam uma rede neural treinada, por exemplo, ou outros modelos de aprendizado de máquina. Esse blob pode ter um tamanho de muitos GB e sua criação ainda não é um AFAIK padronizado, que traz as organizações de volta à era anterior ao IC. No entanto, eles têm sua versão e coleções associadas de dados de treinamento (corpora), que tendem a crescer rapidamente também.
Quais são as práticas recomendadas para enfrentar esse novo desafio usando os métodos DevOps - se possível?