Estou tentando entender como e por que a transformação de Fourier é usada no processamento de imagens / visão computacional. Abaixo está o que eu reuni até agora. Minha compreensão disso seria correta? Se não, alguém poderia me explicar em inglês simples e claro? Ou alguém tem algo a acrescentar? Por último, mas não menos importante, alguém poderia explicar a "transformada discreta de Fourier"?
A transformação de Fourier decompõe uma imagem em seus componentes seno e cosseno. Simplificando, seno e cosseno são ondas que começam no mínimo e no máximo, respectivamente. No mundo real, não podemos dizer se uma onda que observamos começou em um ponto máximo ou mínimo e, portanto, não podemos realmente distinguir entre as duas. Portanto, seno e cosseno são simplesmente referidos como sinusóides.
Ao aplicar o TF a uma imagem, nós o transformamos de seu domínio espacial em um "domínio de frequência", que em essência é a imagem representada em termos de sua variação de cor e brilho ao longo do tempo (bem, não tempo, mas espaço. é, com vários pixels).
EDIT: Por que eu usaria a transformada de Fourier? E quais são seus benefícios sobre outros métodos? Por exemplo, uma aplicação na literatura é no reconhecimento de forma ou eliminação de ruído. Em termos básicos, como alguém poderia reconhecer o formato usando o FT?