Qual a diferença entre 'recursos' e 'descritores' em visão computacional / aprendizado de máquina?


7

Eu li várias frases de tempo semelhantes a

Finalmente, para classificação padrão de imagem, os recursos de palavras com base em descritores SIFT foram considerados críticos para altos desempenhos. Primeiro, calculamos um descritor SIFT padrão em pontos de grade regulares sobre toda a imagem.

Fonte: "Segmentação de imagens em várias classes usando campos aleatórios condicionais e classificação global" por Nils Plath, Marc Toussaint, Shinichi Nakajima.

O que é um descritor? Eu pensei que SIFT é um algoritmo que opera em imagens e fornece recursos (vetores em , onde é fixo para um tamanho fixo de imagens e parâmetros do algoritmo SIFT)?Rnn

Respostas:


2

O vetor do descritor SIFT é um vetor de recurso. "Vetor descritor" e "vetor recurso" são sinônimos neste contexto. A maioria das descrições de SIFT que eu já vi usa a frase "vetor descritor", mas ocasionalmente elas se referem a ela como "vetor de característica" ou como "características de SIFT", talvez para se basear na intuição do aprendizado de máquina .

O SIFT trabalha analisando a imagem, identificando um conjunto de pontos-chave (um conjunto de pontos na imagem que será útil para o alinhamento) e, em seguida, para cada ponto-chave, ele calcula um vetor descritor (um vetor de recurso). Em seguida, ele usa os vetores descritores para os pontos-chave na imagemEu1 1 e os vetores descritores para os pontos-chave na imagem Eu2para tentar alinhar as duas imagens. A intuição é que, se o vetor descritor de um ponto-chave na imagemEu1 1 é "semelhante" a um vetor descritor para um ponto-chave na imagem Eu2, talvez esses dois pontos devam estar alinhados um ao outro. Aqui "semelhança" é medida pela distância euclidiana entre os dois vetores descritores.

Assim, um vetor descritor para um ponto-chave é um vetor, por exemplo, em R128, escolhido para que, se a imagem for traduzida, dimensionada, girada etc., o vetor descritor para esse ponto não será alterado muito pela transformação.

Você pode encontrar uma descrição razoável de SIFT na Wikipedia: https://en.wikipedia.org/wiki/Scale-invariant_feature_transform


Acho a resposta útil, pergunto-me por que ela não é aceita.
precisa saber é
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.