Quão viável seria classificar a textura de uma imagem usando recursos de uma transformada discreta de cosseno? Ao pesquisar no Google "textura classificação dct", apenas encontramos um único artigo acadêmico sobre esse tópico, usando uma rede neural.
Para minha aplicação, tenho um grande conjunto de imagens rotuladas, nas quais a imagem inteira é uma textura consistente (por exemplo, fotos em close de um cobertor, casca de árvore, campo gramado etc.).
Inspirado por uma resposta a uma pergunta anterior , eu estava considerando a seguinte abordagem:
- divida cada imagem em blocos NxN de pixels
- tomar o DCT de cada bloco
- achatar cada DCT em uma matriz de 1xM e alimentá-lo com um algoritmo de cluster K-Means e obter o rótulo do cluster para cada DCT
- calcular um histograma de etiquetas de cluster para cada imagem, contando cada etiqueta por imagem de # 3
- treine um classificador SVM, alimentando-o com um conjunto de [(histograma, rótulo da imagem)]
Quão bem isso funcionaria? Eu implementei um sistema semelhante, usando recursos extraídos pelos algoritmos SIFT / SURF, mas só consegui obter cerca de 60% de precisão.
De que outras maneiras eu poderia usar o DCT para classificar texturas?