Respostas:
De acordo com o artigo Uma comparação de detectores de rosto e cabeça baseados em CNN para aplicações de vigilância por vídeo em tempo real As redes neurais baseadas em CNN são significativamente melhores que Viola-Jones em termos de precisão, mas precisam de mais poder computacional para calcular os resultados. O erro médio de precisão médio para redes baseadas em CNN é 5 vezes menor que para VJ para dados FDDB. Aqui está a tabela de comparação de precisão do artigo:
Mas o VJ permite o reconhecimento em tempo real com 60 quadros por segundo. Aqui está a comparação de velocidade do mesmo artigo: