Quais são os métodos mais avançados para segmentação de pessoas e identificação de poses de pessoas

Eu sei que o HOG é um estado da arte bastante para a detecção de pessoas, mas, na sua forma original, o HOG é apenas um método de detecção, e também não acredito que seja particularmente rápido (existe uma aceleração significativa que pega a janela deslizante e rejeita possibilidades improváveis cedo, mas foi patenteado).

Qual é a abordagem atual do estado da arte para determinar a pose de uma pessoa (incluindo poses próximas, como um tiro na cabeça, tiro na mão, etc ...) e para segmentar a pessoa do fundo?

A configuração aqui é imagens estáticas.

computer-vision image-segmentation face-detection

— John Robertson
fonte

O estado da técnica requer uma câmera de profundidade. Acho que o kinect :)

— nav

Infelizmente, o contexto é que ele precisa trabalhar em arquivos de imagem plana existentes.

— John Robertson

Confira o trabalho de Yang e Ramanan com uma mistura flexível de peças. Começa com uma parte central, mas os pares de partes anexadas são detectados em conjunto, estimando a probabilidade de que a área da imagem consultada ofereça suporte à coocorrência das partes anexadas na imagem. Presume-se erro no anexo e é minimizado usando um modelo de mola. Cada parte é detectada usando técnicas no estilo HOG, e todos os pares de peças na 'árvore' humana são iterados para determinar a detecção. Na minha experiência, ele tem uma taxa de alarme falso muito boa, mas requer aceleração de hardware para aplicativos em tempo real.

— mikeTronix
fonte