Estou tentando treinar uma rede neural para detectar caixas de papelão junto com várias classes de pessoas (pessoas).
Embora seja fácil detectar pessoas e classificá-las corretamente, é incrivelmente difícil detectar caixas de papelão.
As caixas ficam assim:
Minha suspeita é que a caixa é um objeto muito simples , e a rede neural tem dificuldade em detectá-lo porque há muito poucos recursos para extrair do objeto.
A divisão do conjunto de dados fica assim:
personA: 1160
personB: 1651
personC: 2136
person: 1959
box: 2798
As pessoas estão usando itens de segurança diferentes, com base nos itens classificados, enquanto detectados como pessoa inteira, não apenas no item.
Eu tentei usar:
ssd300_incetpionv2
ssd512_inceptionv2
faster_rcnn_inceptionv2
Tudo isso está detectando e classificando pessoas muito melhor do que caixas. Não posso fornecer exatamente mAP
(não o tenho).
Alguma ideia?
Obrigado.