Estou procurando recomendações de uma ferramenta boa e gratuita para gerar dados de amostra com o objetivo de carregar em bancos de dados de teste. Por analogia, algo que produz texto " lorem ipsum " para qualquer RDBMS. Os recursos que procuro incluem:
- Flexibilidade para gerar dados para uma definição de tabela existente.
- Capacidade de gerar conjuntos de dados pequenos e grandes (> 1 milhão de linhas ou mais).
- Gere no formato de script SQL (
INSERT
instruções) ou então em um formato de arquivo simples adequado para importação em massa (que geralmente é mais rápido). - Uma interface de linha de comando para facilitar a criação de scripts.
- Extensível, código-fonte aberto, escrito em uma linguagem dinâmica (são requisitos agradáveis de se ter, e não requisitos fortes).
PS: Eu pesquisei uma pergunta duplicada no StackOverflow, mas não encontrei uma. Se houver um, ficarei grato por uma indicação sobre ele.
Obrigado pelas ótimas respostas a todos! Devo corrigir meus requisitos para usar o Mac OS X como meu ambiente de desenvolvimento principal, não o Windows (embora eu tenha dito que a interface de linha de comando é desejável, e isso praticamente exclui o Windows). As sugestões específicas do Windows serão, sem dúvida, úteis para outros leitores desta questão, então, obrigado.
Aqui está minha conclusão:
- GenerateData:
- Interface de aplicativo da web PHP, não linha de comando
- limitado a gerar 200 registros (ou pagar $ 20 pela licença para gerar 5.000 registros)
- RedGate SQL Data Generator
- não grátis, preço $ 295
- requer Windows, .NET, SQL Server
- Visual Studio 2008 Database Edition
- requer Windows
- requer assinatura de MSDN ou ISV cara
- Banner Datadect
- não grátis, preço $ 595
- requer Windows (?)
- sem suporte para MySQL (?)
- GUI, não de linha de comando ou scriptável
- Joia Ruby Faker
- muito lento para usar ActiveRecord para carregamento de dados em massa
- Super Smack
- principalmente uma ferramenta de teste de carga, com um gerador de dados aleatórios integrado
- muito simples de usar, no entanto
- no geral, uma boa ferramenta de vice-campeão
- Databene Benerator
- melhor solução para minhas necessidades
- Scripts XML, compatíveis com DbUnit
- código Java de código aberto (GPL)
- uso de linha de comando
- acesse muitos bancos de dados diretamente via JDBC