A classificação da imagem é a tarefa de atribuir um dos rótulos conhecidos anteriormente a uma determinada imagem. Por exemplo, você sabe que receberá duas fotos e cada imagem contém exatamente uma de . O algoritmo deve dizer o que a foto mostra.
O conjunto de dados de referência para classificação de imagem é ImageNet ; especialmente o desafio de reconhecimento visual em larga escala (LSVRC) . Ele tem exatamente 1000 aulas e uma enorme quantidade de dados de treinamento (acho que há uma versão reduzida com cerca de 250px x 250px imagens, mas muitas imagens parecem ser do Flicker).
Esse desafio geralmente é resolvido com CNNs (ou outras redes neurais).
Existe algum artigo que tente uma abordagem que não use redes neurais no LSVRC?
Para esclarecer a pergunta: Claro, existem outros algoritmos de classificação como vizinhos mais próximos ou SVMs. No entanto, duvido que funcionem para tantas classes / tantos dados. Pelo menos para -NNs, tenho certeza de que a previsão seria extremamente lenta; para SVMs, acho que tanto o ajuste quanto a previsão seriam muito lentos (?).