Então, eu estava lendo o artigo sobre SURF (Bay, Ess, Tuytelaars, Van Gool: Recursos Robustos Acelerados (SURF) ) e não consigo compreender este parágrafo abaixo:
Devido ao uso de filtros de caixa e imagens integrais, não precisamos aplicar iterativamente o mesmo filtro à saída de uma camada filtrada anteriormente, mas podemos aplicar filtros de caixa de qualquer tamanho exatamente à mesma velocidade diretamente na imagem original e mesmo em paralelo (embora o último não seja explorado aqui). Portanto, o espaço da escala é analisado aumentando o tamanho do filtro em vez de reduzir iterativamente o tamanho da imagem, figura 4.
This is figure 4 in question.
PS: O artigo possui uma explicação da imagem integral, no entanto, todo o conteúdo do artigo é baseado no parágrafo específico acima. Se alguém leu este documento, você pode mencionar brevemente o que está acontecendo aqui. Toda a explicação matemática é bastante complexa para se entender primeiro, por isso preciso de ajuda. Obrigado.
Editar, alguns problemas:
1
Cada oitava é subdividida em um número constante de níveis de escala. Devido à natureza discreta das imagens integrais, a diferença mínima de escala entre duas escalas subseqüentes depende do comprimento lo dos lóbulos positivos ou negativos da derivada parcial de segunda ordem na direção da derivação (x ou y), definida como terço do comprimento do tamanho do filtro. Para o filtro 9x9, esse comprimento é 3. Para dois níveis sucessivos, devemos aumentar esse tamanho em no mínimo 2 pixels (um pixel de cada lado) para manter o tamanho irregular e, assim, garantir a presença do pixel central . Isso resulta em um aumento total do tamanho da máscara em 6 pixels (veja a figura 5).
Figure 5
Eu não conseguia entender as linhas no contexto fornecido.
Por dois níveis sucessivos, devemos aumentar esse tamanho em no mínimo 2 pixels (um pixel de cada lado) para manter o tamanho desigual e, assim, garantir a presença do pixel central.
Eu sei que eles estão tentando fazer algo com o comprimento da imagem, se é que eles estão tentando torná-lo estranho, de modo que haja um pixel central que lhes permita calcular o máximo ou o mínimo do gradiente de pixel. Estou um pouco duvidoso quanto ao seu significado contextual.
2)
Para calcular o descritor, é usada a waaret Haar.
Como a região do meio tem baixo mas alto.
3)
Qual é a necessidade de ter um filtro aproximado?
4. Não tenho problema com a maneira como descobriram o tamanho do filtro. Eles "fizeram" algo empiricamente. No entanto, tenho algum problema persistente com esse pedaço de linha
A saída do filtro 9x9, apresentada na seção anterior, é considerada como a camada de escala inicial, à qual nos referiremos como escala s = 1,2 (aproximando derivadas gaussianas com σ = 1,2).
Como eles descobriram o valor de σ. Além disso, como é que o cálculo da escala é mostrado na imagem abaixo. A razão pela qual afirmo sobre essa imagem é que o valor de s=1.2
continua recorrente, sem indicar claramente sua origem.
5.
A matriz hessiana representada em termos da L
qual é a convolução do gradiente de segunda ordem do filtro gausssiano e da imagem.
No entanto, diz-se que o determinante "aproximado" contém apenas termos que envolvem filtro gaussiano de segunda ordem.
O valor de w
é:
Minha pergunta: por que o determinante é calculado dessa forma acima e qual é a relação entre a matriz hessiana aproximada e a matriz hessiana?