Como posso colocar um banco de dados no git (controle de versão)?


274

Estou fazendo um aplicativo da web e preciso fazer uma ramificação para algumas mudanças importantes, o que ocorre é que essas alterações exigem alterações no esquema do banco de dados, então eu gostaria de colocar todo o banco de dados no git também.

Como faço isso? existe uma pasta específica que eu possa manter em um repositório git? Como sei qual? Como posso ter certeza de que estou colocando a pasta correta?

Eu preciso ter certeza, porque essas alterações não são compatíveis com versões anteriores; Não posso me dar ao luxo de estragar.

O banco de dados no meu caso é o PostgreSQL

Editar:

Alguém sugeriu fazer backups e colocar o arquivo de backup sob controle de versão em vez do banco de dados. Para ser sincero, acho isso muito difícil de engolir.

Tem que haver uma maneira melhor.

Atualizar:

OK, então não há uma maneira melhor, mas ainda não estou totalmente convencido, então vou mudar um pouco a questão:

Gostaria de colocar todo o banco de dados sob controle de versão. Qual mecanismo de banco de dados posso usar para que eu possa colocar o banco de dados real sob controle de versão em vez de seu despejo?

O sqlite seria compatível com o git?

Como esse é apenas o ambiente de desenvolvimento, posso escolher o banco de dados que desejar.

Edit2:

O que eu realmente quero não é rastrear meu histórico de desenvolvimento, mas poder mudar do meu ramo "novas mudanças radicais" para o "ramo estável atual" e, por exemplo, corrigir alguns bugs / problemas, etc., com o atual ramo estável. De modo que, quando troco de ramificação, o banco de dados se torna automaticamente magicamente compatível com a ramificação em que estou atualmente. Eu realmente não me importo muito com os dados reais.


5
Para ser sincero, eu apenas faço cópias do banco de dados se estou introduzindo alterações de esquema e preciso lidar com várias ramificações de desenvolvimento ao mesmo tempo ... os bancos de dados dev devem ser pequenos o suficiente para fazer isso. Eu consideraria qualquer sistema que tentasse ser inteligente e fazer alterações no banco de dados apenas porque alterei o ramo de origem com suspeita. E também gostaria de ter certeza de que as coisas continuariam funcionando se eu simplesmente clonasse minha área de trabalho e tivesse uma ramificação em um local e a outra no novo.
Araqnid 11/05/09


Se você considerar o script (e seus componentes) para iniciar seu banco de dados como um artefato sob controle de versão, os 'backups' poderão não parecer tão ruins. Se você alterar seu esquema db em uma ramificação radical, precisará atualizar o script que inicia o banco de dados com os dados.
Fuhrmanator

1
Verificação geral minha resposta para um software que faz isso exatamente: stackoverflow.com/a/28123546/1662984
Kevin

Respostas:


140

Faça um despejo de banco de dados e controle de versão. Dessa forma, é um arquivo de texto simples.

Pessoalmente, sugiro que você mantenha um despejo de dados e um despejo de esquema. Dessa maneira, usando diff, fica bastante fácil ver o que mudou no esquema de revisão em revisão.

Se você estiver fazendo grandes alterações, deverá ter um banco de dados secundário no qual altera o novo esquema e não toque no antigo, pois, como disse que está fazendo uma ramificação.


132
O que? Tem que haver uma maneira melhor.
hasen

18
Os arquivos de banco de dados PostGreSQL são arquivos binários, sinta-se à vontade para colocá-los em seu repositório git, você simplesmente não poderá fazer nenhuma diferença neles e quaisquer alterações provavelmente mudarão todo o banco de dados e, portanto, agora você deve enviar o arquivo completo. banco de dados por fio para o seu repositório git e armazene-o. Isso é ineficiente, lento e torna extremamente difícil trabalhar. Além disso, não tenho certeza de que os arquivos de banco de dados armazenados em disco sem o VACUUM e que desliguem o PostgreSQL para fazer uma cópia sejam "estáveis", pois em todos os dados estão sempre corretos, possivelmente deixando-o com dados corrompidos.
X-Istence

6
Ah, entendi! Bem, existem sistemas de banco de dados mais amigáveis ​​ao git?
hasen

16
Esse tipo de solução é bastante padrão e o esquema é realmente o código fonte.
Dana the Sane

12
é 2017, alguma atualização sobre essa questão? existe realmente nenhum controle de versão do DB pronto para uso? realmente ?
Stavm

48

Consulte Refatoração de bancos de dados ( http://databaserefactoring.com/ ) para obter um monte de boas técnicas para manter seu banco de dados em conjunto com as alterações de código.

Basta dizer que você está fazendo as perguntas erradas. Em vez de colocar seu banco de dados no git, você deve decompor suas alterações em pequenas etapas verificáveis ​​para poder migrar / reverter as alterações de esquema com facilidade.

Se você deseja ter capacidade de recuperação total, considere arquivar seus logs WAL do postgres e use o PITR (recuperação pontual) para reproduzir / encaminhar transações para estados conhecidos conhecidos específicos.


2
Eu não encontrar informação relevante no site databaserefactoring ... Parece listar várias técnicas de refatoração de código DB (como Fowler fez para o código regular)
Nickolay

26

Estou começando a pensar em uma solução realmente simples, não sei por que não pensei nisso antes!

  • Duplique o banco de dados (o esquema e os dados).
  • Na ramificação das novas mudanças importantes, basta alterar a configuração do projeto para usar o novo banco de dados duplicado.

Dessa forma, eu posso alternar ramificações sem me preocupar com alterações no esquema do banco de dados.

EDITAR:

Por duplicado, quero dizer criar outro banco de dados com um nome diferente (como my_db_2); não fazendo um despejo ou algo assim.


3
Esta parece ser a solução mais simples e eficiente, mas seria bom se houvesse alguma maneira de automatizar isso ... Estou surpreso por ainda não haver algo lá fora ...
JustMaier:

gancho git para criar um banco de dados a partir do modelo baseado no nome do ramo,
dalore

É isso que faço, também adiciono uma linha de verificação de IP ao arquivo de inclusão para as variáveis ​​do banco de dados, para que, se acidentalmente carregue o arquivo da ramificação "incorreta" no servidor ativo, nada quebre.
Liamvictor 5/05

praticamente todos os ramos obtêm seu próprio banco de dados, não é? 🤔
Olli

19

Use algo como LiquiBase para manter o controle de revisão dos seus arquivos Liquibase. você pode marcar alterações somente para produção e manter o banco de dados atualizado para produção ou desenvolvimento (ou qualquer esquema que desejar).


3
As melhores práticas do Liguibase recomendam manter os scripts de criação de esquema como um conjunto de scripts seqüenciais a serem executados em ordem. Embora essa seja uma boa prática, não vejo como isso funcionaria sem um repositório central, que é un-GIT.
Frank Schwieterman

1
Bem, funcionaria muito bem no git se você fosse cuidadoso com as tags id = e author =. Em teoria, cada usuário teria sua própria entrada de autor (GOOD) e, se você fizer algo razoável com id =, diga YYYYMMDD_REV, estará pronto. Mesmo com o git, quase todo mundo tem um 'repositório central', para um determinado projeto. 99% das pessoas não têm algo 'central'. Novamente, os arquivos Liquibase são apenas planos de arquivos XML-ish de texto, com uma pilha de comandos para executar em um determinado banco de dados (ou conjunto de). Provavelmente, 99% de todos os projetos teriam 0 problemas após isso na prática, mesmo com DVCS.
zie 30/03/10

+1 para esta resposta. É isso que usamos em vários projetos. Os IDs precisam ser exclusivos em apenas um arquivo xml. Se você nomear os IDs do caso de uso que está sendo implementado, eles serão exclusivos o suficiente. Você deve ter cuidado para não modificar conjuntos de alterações já aplicados, caso contrário, obterá erros de soma de verificação.
13Bernardn

7

Enfrentou uma necessidade semelhante e aqui está o que minha pesquisa sobre sistemas de controle de versão de banco de dados levantou:

  1. Sqitch - código aberto baseado em perl; disponível para todos os principais bancos de dados, incluindo o PostgreSQL https://github.com/sqitchers/sqitch
  2. Mahout - somente para PostgreSQL; controle de versão do esquema de banco de dados de código-fonte aberto. https://github.com/cbbrowne/mahout
  3. Liquibase - outro controle de versão de código aberto db sw. versão gratuita do Datical. http://www.liquibase.org/index.html
  4. Datical - versão comercial do Liquibase - https://www.datical.com/
  5. Viaduto por BoxFuse - sw comercial. https://flywaydb.org/
  6. Outro projeto de código aberto https://gitlab.com/depesz/Versioning Author fornece um guia aqui: https://www.depesz.com/2010/08/22/versioning/
  7. Automação de alteração do Red Gate - somente para SQL Server. https://www.red-gate.com/products/sql-development/sql-change-automation/

No passado, também havia algo chamado ChronicDB: ChronicDB provides dynamic database upgrades with zero database downtime and inconsistencies. crunchbase.com/organization/chronicdb#section-overview Um cara chamado Kristis Makris foi um dos fundadores, talvez conhecido pelo SCMBug: mkgnu.net/scmbug
Thorsten Schöning

6

Existe um ótimo projeto chamado Migrações no Doctrine, criado apenas para esse fim.

Ainda está no estado alfa e foi construído para php.

http://docs.doctrine-project.org/projects/doctrine-migrations/en/latest/index.html


ops! seu link está quebrado ... talvez você esteja falando sério: github.com/doctrine/migrations #
Francesco Casula

aqui os documentos para o pacote que integram as migrações doutrina em Symfony2: symfony.com/doc/master/bundles/DoctrineMigrationsBundle/...
Francesco Casula

1
Obrigado pela dica, a equipe do Doctrine tem a tendência de alterar a localização dos documentos, resultando em muitos links quebrados, aqui e no Google. Corrigido o link.
Hakan Deryal 31/08/2012

4

Eu me deparei com essa pergunta, pois tenho um problema semelhante, onde algo que se aproxima de uma estrutura de diretório baseada em banco de dados, armazena 'arquivos' e preciso do git para gerenciá-lo. É distribuído, através de uma nuvem, usando replicação; portanto, seu ponto de acesso será via MySQL.

A essência das respostas acima, parece sugerir similarmente uma solução alternativa para o problema solicitado, que meio que esquece o ponto, de usar o Git para gerenciar algo em um banco de dados, então tentarei responder a essa pergunta.

Git é um sistema que, em essência, armazena um banco de dados de deltas (diferenças), que podem ser remontados, a fim de reproduzir um contexto. O uso normal do git assume que o contexto é um sistema de arquivos e esses deltas são diferenciais nesse sistema de arquivos, mas na verdade todo o git é um banco de dados hierárquico de deltas (hierárquico, porque na maioria dos casos, cada delta é um commit com pelo menos 1 pais, dispostos em uma árvore).

Desde que você possa gerar um delta, em teoria, o git pode armazená-lo. O problema normalmente é que o git espera que o contexto, no qual está gerando delta, seja um sistema de arquivos e, da mesma forma, quando você faz check-out de um ponto na hierarquia do git, espera gerar um sistema de arquivos.

Se você deseja gerenciar alterações, em um banco de dados, você tem 2 problemas distintos e eu os solucionaria separadamente (se eu fosse você). O primeiro é o esquema, o segundo são os dados (embora na sua pergunta, você declare que os dados não são algo com que se preocupa). Um problema que eu tinha no passado era um banco de dados Dev e Prod, no qual o Dev podia realizar alterações incrementais no esquema, e essas alterações tinham que ser documentadas no CVS e propagadas para viver, além de adições a um dos vários 'estáticos' tabelas. Fizemos isso tendo um terceiro banco de dados, chamado Cruise, que continha apenas os dados estáticos. A qualquer momento, o esquema de Dev e Cruise poderia ser comparado, e tínhamos um script para pegar o diff desses 2 arquivos e produzir um arquivo SQL contendo instruções ALTER, para aplicá-lo. Da mesma forma, quaisquer novos dados, pode ser destilado em um arquivo SQL contendo comandos INSERT. Desde que campos e tabelas sejam adicionados apenas e nunca excluídos, o processo poderá automatizar a geração das instruções SQL para aplicar o delta.

diffÉ chamado o mecanismo pelo qual o git gera deltas e o mecanismo pelo qual ele combina 1 ou mais deltas com um arquivo merge. Se você pode criar um método para diferenciar e mesclar a partir de um contexto diferente, o git deve funcionar, mas como foi discutido, você pode preferir uma ferramenta que faça isso por você. Meu primeiro pensamento para resolver isso é este https://git-scm.com/book/en/v2/Customizing-Git-Git-Configuration#External-Merge-and-Diff-Tools que detalha como substituir o diff interno do git e ferramenta de mesclagem. Atualizarei esta resposta, à medida que encontrar uma solução melhor para o problema, mas, no meu caso, espero ter que gerenciar apenas alterações de dados, até o ponto em que um armazenamento de arquivos baseado em banco de dados possa mudar, portanto, minha solução pode não ser exatamente o que você precisa.


3

Dê uma olhada no RedGate SQL Source Control.

http://www.red-gate.com/products/sql-development/sql-source-control/

Essa ferramenta é um snap-in do SQL Server Management Studio que permitirá que você coloque seu banco de dados no Source Control with Git.

É um pouco caro por US $ 495 por usuário, mas há uma avaliação gratuita de 28 dias disponível.

NOTA Eu não sou afiliado à RedGate de nenhuma maneira.


3

Quero fazer algo semelhante, adicionar minhas alterações no banco de dados ao meu sistema de controle de versão.

Vou seguir as idéias deste post de Vladimir Khorikov "Melhores práticas de controle de versão de banco de dados" . Em resumo, vou

  • armazene seu esquema e os dados de referência em um sistema de controle de origem.
  • para cada modificação, criaremos um script SQL separado com as alterações

Caso isso ajude!


3
  • Irmin
  • Flur.ee
  • Crux DB

Eu tenho procurado o mesmo recurso para o Postgres (ou bancos de dados SQL em geral) há algum tempo, mas não achei ferramentas adequadas (simples e intuitivas) o suficiente. Provavelmente, isso se deve à natureza binária de como os dados são armazenados. Klonio parece ideal, mas parece morto. Noms DB parece interessante ( e vivo ). Veja também o Irmin (baseado em OCaml com propriedades Git).

Embora isso não responda à pergunta, pois funcionaria com o Postgres, consulte o banco de dados Flur.ee. Possui um recurso de "viagem no tempo" que permite consultar os dados de um ponto no tempo arbitrário. Estou supondo que deve ser capaz de trabalhar com um modelo de "ramificação".

Esse banco de dados foi desenvolvido recentemente para fins de blockchain. Devido à natureza das blockchains, os dados precisam ser registrados em incrementos, que é exatamente como o git funciona. Eles estão visando um lançamento de código aberto no segundo trimestre de 2019 .

Como cada banco de dados Fluree é uma cadeia de blocos, ele armazena todo o histórico de todas as transações realizadas. Isso faz parte de como uma blockchain garante que as informações sejam imutáveis ​​e seguras .

Atualização : Confira também o banco de dados Crux , que pode consultar a dimensão temporal das inserções, que você pode ver como 'versões'. O ponto crucial parece ser uma implementação de código aberto do altamente apreciado Datomic.

O Crux é um banco de dados bitemporal que armazena o tempo de transação e históricos de tempo válidos. Enquanto um banco de dados [uni] temporal permite a consulta de "viagem no tempo" através da sequência transacional dos estados do banco de dados desde o momento da criação do banco de dados até seu estado atual, o Crux também fornece consulta de "viagem no tempo" por um eixo de tempo válido discreto sem complexidade desnecessária de projeto ou impacto no desempenho. Isso significa que um usuário do Crux pode preencher o banco de dados com informações passadas e futuras, independentemente da ordem em que as informações chegam, e fazer correções nas gravações passadas para criar um modelo temporal cada vez melhor de um determinado domínio.


2

Você não pode fazê-lo sem atomicidade e não pode obter atomicidade sem usar pg_dump ou um sistema de arquivos de captura instantânea.

Minha instância do postgres está no zfs, que eu tiro instantaneamente. É aproximadamente instantâneo e consistente.


2

O que você deseja, em espírito, talvez seja algo como o Post Facto , que armazena versões de um banco de dados em um banco de dados. Confira esta apresentação .

Aparentemente, o projeto nunca foi realmente a lugar algum, então provavelmente não o ajudará imediatamente, mas é um conceito interessante. Receio que fazer isso corretamente seja muito difícil, porque até a versão 1 precisaria acertar todos os detalhes para que as pessoas confiassem seu trabalho.


2

Lancei uma ferramenta para sqlite que faz o que você está pedindo. Ele usa um driver diff personalizado que utiliza a ferramenta de projetos do sqlite 'sqldiff', os UUIDs como chaves primárias e deixa de fora o sqlite rowid. Ainda está em alfa, então o feedback é apreciado.

O Postgres e o mysql são mais complicados, pois os dados binários são mantidos em vários arquivos e podem até não ser válidos se você puder capturá-los.

https://github.com/cannadayr/git-sqlite


Parece que você deixou o git armazenar os dados binários como estão. Em vez disso, pode-se usar filtros de limpeza / manchas para armazenar lixões. Existem alguns scripts que fazem isso.
max630

1
Abordagem decente, exceto quando você difere dois estados do banco de dados, está executando uma difusão textual do dump. Ao usar o sqldiff como um driver diff personalizado, você obtém os comandos reais para alterar seu banco de dados para o próximo estado.
cannadayr

1

Eu acho que o X-Istence está no caminho certo, mas há mais algumas melhorias que você pode fazer nessa estratégia. Primeiro uso:

$pg_dump --schema ... 

despejar as tabelas, seqüências, etc. e colocar esse arquivo sob controle de versão. Você usará isso para separar as alterações de compatibilidade entre suas filiais.

Em seguida, execute um despejo de dados para o conjunto de tabelas que contêm a configuração necessária para que seu aplicativo funcione (provavelmente deve ignorar dados do usuário, etc.), como padrões de formulário e outros dados não modificáveis ​​por usuário. Você pode fazer isso seletivamente usando:

$pg_dump --table=.. <or> --exclude-table=..

Essa é uma boa idéia, pois o repositório pode ficar muito complicado quando o banco de dados atinge 100 Mb + ao fazer um despejo de dados completo. Uma idéia melhor é fazer backup de um conjunto de dados mais mínimo necessário para testar seu aplicativo. Se os dados padrão forem muito grandes, isso ainda poderá causar problemas.

Se você absolutamente precisar colocar backups completos no repositório, considere fazê-lo em uma ramificação fora da sua árvore de origem. Um sistema de backup externo com alguma referência à svn rev correspondente provavelmente é melhor para isso.

Além disso, sugiro usar dumps de formato de texto sobre binários para fins de revisão (pelo menos para o esquema), pois são mais fáceis de diferenciar. Você sempre pode compactá-las para economizar espaço antes do check-in.

Por fim, dê uma olhada na documentação de backup do postgres, se você ainda não o fez. A maneira como você está comentando sobre o backup do 'banco de dados' em vez de um despejo me faz pensar se você está pensando em backups baseados em sistema de arquivos (consulte a seção 23.2 para advertências).


o despejo não é apenas um backup?
hasen

Sim, mas você pode restaurá-lo em um banco de dados alternativo e fazer suas modificações lá.
Dana the Sane

1

Esta pergunta é praticamente respondida, mas eu gostaria de complementar a resposta de X-Istence e Dana the Sane com uma pequena sugestão.

Se você precisar de controle de revisão com algum grau de granularidade, digamos diariamente, poderá associar o despejo de texto das tabelas e do esquema a uma ferramenta como rdiff-backup, que faz backups incrementais. A vantagem é que, em vez de armazenar instantâneos de backups diários, você simplesmente armazena as diferenças do dia anterior.

Com isso, você tem a vantagem do controle de revisão e não perde muito espaço.

De qualquer forma, usar o git diretamente em grandes arquivos simples que mudam com muita frequência não é uma boa solução. Se seu banco de dados ficar muito grande, o git começará a ter alguns problemas no gerenciamento dos arquivos.


1

Aqui está o que estou tentando fazer em meus projetos:

  • separar dados e esquema e dados padrão.

A configuração do banco de dados é armazenada no arquivo de configuração que não está sob controle de versão (.gitignore)

Os padrões do banco de dados (para configurar novos projetos) são um arquivo SQL simples sob controle de versão.

Para o esquema do banco de dados, crie um dump do esquema do banco de dados sob o controle de versão.

A maneira mais comum é ter scripts de atualização que contenham instruções SQL (ALTER Table .. ou UPDATE). Você também precisa ter um lugar em seu banco de dados onde salve a versão atual do seu esquema)

Dê uma olhada em outros grandes projetos de banco de dados de código aberto (piwik ou seu sistema cms favorito), todos eles usam scripts de atualização (1.sql, 2.sql, 3.sh, 4.php.5.sql)

Mas esse é um trabalho muito demorado, você precisa criar e testar os scripts de atualização e precisa executar um script de atualização comum que compare a versão e execute todos os scripts de atualização necessários.

Então, teoricamente (e é isso que estou procurando), você pode despejar o esquema do banco de dados após cada alteração (manualmente, conjob, git hooks (talvez antes do commit)) (e apenas em alguns casos muito especiais criar updatescripts)

Depois disso, no seu script de atualização comum (execute os scripts de atualização normais, para os casos especiais), compare os esquemas (o dump e o banco de dados atual) e gere automaticamente as Instruções ALTER. Existem algumas ferramentas que já podem fazer isso, mas ainda não foram boas.


1

Eu recomendaria o neXtep para controlar a versão do banco de dados. Ele possui um bom conjunto de documentação e fóruns que explica como instalar e os erros encontrados. Eu testei para o postgreSQL 9.1 e 9.3, consegui fazê-lo funcionar para a 9.1, mas para a 9.3 parece não funcionar.


@ Nickolay Sim, parece que ele foi descontinuado. Como uma alternativa, por que não tentar Skitch você vai encontrá-lo aqui sqitch.org
Jerry M Ensolarado

Obrigado, vou verificá-lo!
Nickolay

1

O que faço em meus projetos pessoais é que eu armazeno meu banco de dados inteiro no dropbox e aponto o fluxo de trabalho do MAMP, WAMP para usá-lo a partir daí. Dessa forma, o banco de dados está sempre atualizado, sempre que eu precisar fazer algum desenvolvimento. Mas isso é apenas para dev! Sites ao vivo está usando servidor próprio para isso fora do curso! :)


1

Armazenar cada nível de alterações no banco de dados sob o controle de versão git é como empurrar todo o banco de dados com cada confirmação e restaurar todo o banco de dados com cada solicitação. Se o seu banco de dados é tão propenso a mudanças cruciais e você não pode dar ao luxo de perdê-los, você pode simplesmente atualizar seu pre_commit e post_merge ganchos. Fiz o mesmo com um dos meus projetos e você pode encontrar as instruções aqui .


1

É assim que eu faço:

Como você tem uma escolha livre sobre o tipo de banco de dados, use um banco de dados baseado em arquivo como, por exemplo, firebird.

Crie um banco de dados modelo que tenha o esquema que se adapta à sua ramificação real e armazene-a no seu repositório.

Ao executar seu aplicativo, programaticamente, crie uma cópia do seu banco de dados modelo, armazene-o em outro lugar e trabalhe com essa cópia.

Dessa forma, você pode colocar seu esquema de banco de dados sob controle de versão sem os dados. E se você alterar seu esquema, basta alterar o DB do modelo


1

Costumávamos executar um site social, em uma configuração padrão do LAMP. Tínhamos um servidor ao vivo, um servidor de teste e um servidor de desenvolvimento, além de máquinas de desenvolvedores locais. Todos foram gerenciados usando o GIT.

Em cada máquina, tínhamos os arquivos PHP, mas também o serviço MySQL, e uma pasta com imagens que os usuários carregavam. O servidor Live cresceu para ter cerca de 100K (!) Usuários recorrentes, o despejo era de cerca de 2GB (!), A pasta Image era de cerca de 50GB (!). Quando saí, nosso servidor estava atingindo o limite de sua CPU, Ram e, acima de tudo, os limites de conexão de rede simultâneos (até compilamos nossa própria versão do driver da placa de rede para maximizar o servidor 'lol'). Não foi possível ( nem você deve assumir com seu site ) colocar 2 GB de dados e 50 GB de imagens no GIT.

Para gerenciar tudo isso no GIT com facilidade, ignoraríamos as pastas binárias (as pastas que contêm as imagens) inserindo esses caminhos de pasta no .gitignore. Também tínhamos uma pasta chamada SQL fora do caminho da raiz do documento Apache. Nessa pasta SQL, colocaríamos nossos arquivos SQL dos desenvolvedores em numerações incrementais (001.florianm.sql, 001.johns.sql, 002.florianm.sql, etc). Esses arquivos SQL também foram gerenciados pelo GIT. O primeiro arquivo sql realmente conteria um grande conjunto de esquemas de banco de dados. Não adicionamos dados do usuário no GIT (por exemplo, os registros da tabela de usuários ou da tabela de comentários), mas dados como configurações, topologia ou outros dados específicos do site foram mantidos nos arquivos sql (e, portanto, pelo GIT). Principalmente, são os desenvolvedores (que conhecem melhor o código) que determinam o que e o que não é mantido pelo GIT com relação ao esquema e aos dados SQL.

Quando chegou a uma versão, o administrador efetua login no servidor dev, mescla a ramificação ativa com todos os desenvolvedores e ramificações necessárias na máquina dev em uma ramificação de atualização e a envia ao servidor de teste. No servidor de teste, ele verifica se o processo de atualização do servidor Live ainda é válido e, em rápida sucessão, aponta todo o tráfego no Apache para um site de espaço reservado, cria um dump de banco de dados, aponta o diretório de trabalho da atualização 'ao vivo' para ' ', executa todos os novos arquivos sql no mysql e redireciona o tráfego para o site correto. Quando todas as partes interessadas concordaram após revisar o servidor de teste, o Administrador fez o mesmo do servidor de Teste ao servidor Live. Posteriormente, ele mescla a ramificação ativa no servidor de produção, para a ramificação mestre em todos os servidores, e refaz o rebase de todas as ramificações ativas.

Se houve problemas no servidor de teste, por exemplo. as mesclagens tiveram muitos conflitos, o código foi revertido (apontando o ramo de trabalho de volta para 'live') e os arquivos sql nunca foram executados. No momento em que os arquivos sql foram executados, isso foi considerado uma ação não reversível na época. Se os arquivos SQL não estavam funcionando corretamente, o banco de dados foi restaurado usando o Dump (e os desenvolvedores informaram, por fornecer arquivos SQL mal testados).

Hoje, mantemos uma pasta sql-up e sql-down, com nomes de arquivos equivalentes, onde os desenvolvedores precisam testar se os arquivos sql de atualização podem ser igualmente rebaixados. Em última análise, isso poderia ser executado com um script bash, mas é uma boa idéia se os olhos humanos continuem monitorando o processo de atualização.

Não é ótimo, mas é administrável. Espero que isso dê uma ideia de um site prático, prático e com relativamente alta disponibilidade. Seja um pouco desatualizado, mas ainda seguido.


0

Use uma ferramenta como o iBatis Migrations ( manual , pequeno tutorial em vídeo ) que permite controlar a versão das alterações feitas em um banco de dados durante todo o ciclo de vida de um projeto, em vez do próprio banco de dados.

Isso permite aplicar seletivamente alterações individuais a diferentes ambientes, manter um registro de alterações em quais ambientes, criar scripts para aplicar as alterações de A a N, alterações de reversão etc.


0

Gostaria de colocar todo o banco de dados sob controle de versão. Qual mecanismo de banco de dados posso usar para que eu possa colocar o banco de dados real sob controle de versão em vez de seu despejo?

Isso não depende do mecanismo do banco de dados. Pelo Microsoft SQL Server, existem muitos programas de controle de versão. Eu não acho que esse problema possa ser resolvido com o git, você precisa usar um sistema de controle de versão de esquema específico do pgsql. Não sei se existe ou não ...


2
Você realmente deve dar uma olhada no klonio , feito sob medida para bancos de dados de versão (atualmente suporta Mongo e MySQL). Ainda em beta, mas parece bastante promissor.
FarthVader

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.