Me deparei com o seguinte problema, que reconheço é bastante típico.
Eu tenho alguns dados grandes, digamos, alguns milhões de linhas. Eu executo algumas análises não triviais, por exemplo, uma consulta SQL que consiste em várias subconsultas. Recebo algum resultado, afirmando, por exemplo, que a propriedade X está aumentando com o tempo.
Agora, existem duas coisas possíveis que podem levar a isso:
- X está realmente aumentando ao longo do tempo
- Eu tenho um erro na minha análise
Como posso testar se o primeiro aconteceu, e não o segundo? Um depurador passo a passo, mesmo que exista, não ajudará, pois os resultados intermediários ainda podem consistir em milhões de linhas.
A única coisa em que pude pensar foi de alguma forma gerar um pequeno conjunto de dados sintéticos com a propriedade que eu quero testar e executar a análise nele como um teste de unidade. Existem ferramentas para fazer isso? Particularmente, mas não limitado a, SQL.