Devo esclarecer imediatamente que sou um desenvolvedor de software que pratica, não um estatístico e que minha aula de estatística da faculdade foi há muito tempo ...
Dito isso, eu gostaria de saber se existe um método para acumular um conjunto de estatísticas descritivas que possam ser usadas para produzir um boxplot, que não implica armazenar um monte de amostras individuais?
O que estou tentando fazer é produzir um resumo gráfico dos tempos de serviço da fila em um processo complexo de múltiplas filas. No passado, usei um pacote chamado tnftools que permitia que grandes amostras fossem acumuladas e depois processadas em um bom gráfico de tempos de resposta e outliers ... Mas o tnftools não está disponível para minha plataforma atual.
Idealmente, eu gostaria de poder acumular um conjunto de estatísticas descritivas "on the fly" enquanto o processo é executado e depois extrair os dados para análise sob demanda. Mas não posso simplesmente fazer com que o processo acumule amostras, pois a memória / IO envolvida nesse processo teria um impacto inaceitável no desempenho do sistema.