Quais algoritmos úteis existem que funcionam em enormes fluxos de dados e também seus resultados são razoavelmente pequenos e pode-se calcular o resultado para uma mistura de dois fluxos, de alguma forma, mesclando seus resultados?
Eu posso citar alguns:
- Coisas óbvias como soma, mínimo, máximo, contagem, top-K etc.
- Algoritmos de fluxo "baseados em esboço" aproximados para histogramas, contando itens distintos ou quantis de computação
Que outros existem?
(Estou interessado porque estou escrevendo um projeto de hobby para monitorar sistemas distribuídos cuja utilidade é diretamente determinada pela utilidade de tais algoritmos)