Desejo processar imagens de microscopia segmentadas automaticamente para detectar imagens e / ou segmentações defeituosas, como parte de um pipeline de geração de imagens de alto rendimento. Há vários parâmetros que podem ser calculados para cada imagem e segmentação brutas e que se tornam "extremos" quando a imagem está com defeito. Por exemplo, uma bolha na imagem resultará em anomalias, como um tamanho enorme em uma das "células" detectadas ou uma contagem anormalmente baixa de células para todo o campo. Estou procurando uma maneira eficiente de detectar esses casos anômalos. Idealmente, eu preferiria um método que possua as seguintes propriedades (aproximadamente em ordem de conveniência):
não requer limites absolutos predefinidos (embora porcentagens predefinidas estejam OK);
não requer ter todos os dados na memória, ou mesmo ter visto todos os dados; seria bom que o método fosse adaptável e atualize seus critérios à medida que vê mais dados; (obviamente, com algumas probabilidades pequenas, podem ocorrer anomalias antes que o sistema tenha visto dados suficientes e sejam perdidos etc.)
é paralelizável: por exemplo, em um primeiro turno, muitos nós trabalhando em paralelo produzem anomalias candidatas intermediárias, que passam por uma segunda rodada de seleção após a conclusão da primeira rodada.
As anomalias que estou procurando não são sutis. Eles são do tipo claramente óbvio se olharmos para um histograma dos dados. Mas o volume de dados em questão e o objetivo final de realizar essa detecção de anomalias em tempo real à medida que as imagens são geradas, impedem qualquer solução que exija inspeção de histogramas por um avaliador humano.
Obrigado!