Nossas simulações de dinâmica de plasma geralmente produzem muita informação. Durante as simulações, registramos várias propriedades físicas em uma grade (x, y, z, t) que é tão grande quanto (8192x1024x1024x1500), por pelo menos 10 propriedades. Esta informação é processada após a simulação ser concluída. Com isso nós
- fazer filmes de propriedades,
- realizar uma análise de Fourier,
- calcular propriedades médias.
Esse simples despejo de tanta informação quanto possível funcionou bem quando estudamos sistemas menores. Isso nos deu a flexibilidade de interagir com os resultados e decidir mais tarde o que queríamos fazer com ele. Também nos permitiu alocar nossos recursos computacionais (tempo de CPU) para simplesmente executar as simulações.
Iniciamos o processo de fazer a análise de Fourier em tempo real e filtrar apenas uma faixa selecionada de escalas de comprimento. Por razões numéricas, às vezes precisamos resolver escalas de comprimento menores do que realmente estamos interessados; portanto, nesses casos, esse filtro ajuda bastante. Também estamos explorando várias bibliotecas de E / S paralelas , por exemplo , opções de E / S paralela, em particular HDF5 paralelo .
Quais estratégias estão disponíveis para maximizar a eficiência do processamento de dados?
Existe algum benefício em realizar todas as análises (não incluindo pós-processamento, por exemplo, filmes e plotagens) em tempo real?
Eu posso imaginar esse problema surgindo em outras áreas de pesquisa. Por exemplo, você pode ter uma simulação de dinâmica molecular que precisa evoluir por um longo tempo, mas está interessado no breve momento em que algo interessante está acontecendo. Ou no CFD, o desenvolvimento inicial pode ser lento, mas depois que a turbulência se instala, você pode precisar de uma resolução de tempo maior para monitorar a dinâmica.
Existem exemplos disponíveis gratuitamente de coleta sofisticada de resultados de simulações?