Fundo:
Atualmente, estou executando uma grande quantidade de experimentos de variação de parâmetros. Eles estão sendo executados no Python 2.6+, usando numpy. Esses experimentos levarão cerca de 2 semanas para serem executados.
Aproximadamente, estou variando três parâmetros (variáveis independentes) em um intervalo de valores. Estou corrigindo mais 6 variáveis independentes (por enquanto) estou relatando 4 variáveis dependentes.
Um dos parâmetros que estou variando está sendo distribuído por vários processos (e computadores). Para cada um desses parâmetros, eu gero csv
arquivos separados com cada linha contendo os valores de todas as variáveis (incluindo independentes, fixas e dependentes). Em toda a variação, esperamos gerar cerca de 80.000 linhas de dados
Na maioria das vezes, estou apenas olhando o valor de uma das variáveis dependentes, mas mantenho as outras por perto, pois elas podem explicar o que está acontecendo quando algo inesperado acontece.
Em uma versão anterior desse experimento, variando entre apenas 2 parâmetros (cada um com apenas 2 valores), eu estava copiando colando esse csv
arquivo em um programa de planilha e fazendo várias colagens de cópia para criar uma tabela apenas da variável dependente que me interessava Fazer algumas coisas estranhas no MS-Excel para me deixar ordenar por fórmulas. Isso foi doloroso o suficiente para os 6 conjuntos de resultados de experimentos que tive. No momento em que essa execução terminar, terei 2 ordens de magnitude a mais.
Questão:
Eu estava pensando que, uma vez feito, poderia despejar todos os resultados dos csv
arquivos em um banco de dados e consultar as partes que são interessantes. Em seguida, pegue esses resultados e coloque-os em uma planilha para análise. Fazer gráficos, encontrar pontuações em relação aos resultados do controle, etc.
Estou pensando na linha certa? (É isso que as pessoas fazem?)
Hoje em dia, meu banco de dados está bastante enferrujado, mesmo quando era bom eu estava usando o MS-Access. Eu pretendia usar o MS-Access para isso também.