Eu sei que o HOG é um estado da arte bastante para a detecção de pessoas, mas, na sua forma original, o HOG é apenas um método de detecção, e também não acredito que seja particularmente rápido (existe uma aceleração significativa que pega a janela deslizante e rejeita possibilidades improváveis cedo, mas foi patenteado).
Qual é a abordagem atual do estado da arte para determinar a pose de uma pessoa (incluindo poses próximas, como um tiro na cabeça, tiro na mão, etc ...) e para segmentar a pessoa do fundo?
A configuração aqui é imagens estáticas.