DCT e limiar rígido


8

Se eu tenho uma imagem e encontro o DCT, aplico limiar rígido nos coeficientes e depois no IDCT, atenuando o ruído. Alguém pode me explicar em detalhes ou me indicar a resposta sobre por que isso funciona. Entendo por que um filtro que bloqueia a alta frequência funcionará no denoising (porque assumimos que o ruído consiste em componentes de alta frequência), mas por que o limiar de magnitude funciona?

Respostas:


4

A filtragem passa-baixa baseia-se no pressuposto de que imagens "naturais" têm mais energia nos coeficientes de baixa frequência do que nos coeficientes de alta frequência; enquanto o ruído afetará igualmente todos os coeficientes. Assim, a remoção dos coeficientes de alta frequência eliminará comparativamente mais ruído do que sinal. O problema é que existem coeficientes de alta frequência "legítimos" nas imagens, como bordas. A denoising pela filtragem passa-baixo atenua esses coeficientes e causa o embaçamento das bordas.

A propriedade usada no limiar de magnitude é a esparsidade - é muito provável que imagens "naturais" tenham apenas um pequeno conjunto de altos coeficientes diferentes de zero no domínio da frequência. Adicionar ruído uniforme (e independente de pixel a pixel) é equivalente a adicionar um pequeno valor aleatório a todos os coeficientes de frequência. O resultado é que todos os coeficientes que eram 0 na imagem original agora têm um valor pequeno; enquanto os coeficientes altos na imagem original são relativamente intocados. Limiar os coeficientes de pequena magnitude cancelará a contribuição do ruído nesses coeficientes - embora não recupere o efeito do ruído nos coeficientes altos.

Se você substituir arestas por transientes / ataques, o mesmo se aplica aos sons.


1

Veja o seguinte problema de otimização:

argminx12Axy+λx0

Onde está contando o número de elementos diferentes de zero.0

É sabido que o limiar rígido iterativo pode ser utilizado para resolver isso e, em alguns casos, é garantido que você encontre a solução correta (consulte Limiar rígido iterativo para detecção compactada ).

Agora, se você usar como o Dicionário DCT (que você pode e muitos fazem), basicamente o que você faz é tentar resolver isso.A

Este é o ponto de vista da otimização.
A razão pela qual funciona tão bem, a ideia de representações esparsas (baixo grau de liberdade)?
Bem, a intuição simples é eficiência.
As coisas devem ser simples quando se usa as ferramentas certas para descrevê-las.

Um ótimo lugar para se aprofundar é o eDx - Sparse Representations in Signal and Image Processing: Fundamentals, de Michael Elad .


0

Os DCTs são muito úteis na compactação de energia; portanto, basta colocar depois que um DCT de uma imagem é resolvido para ponderar algumas de algumas funções básicas. Após um DCT, a matriz resultante conterá multiplicadores para cada função básica. E, sem perda de generalidade, podemos dizer que os coeficientes de alto valor são os que contribuem significativamente para a percepção psico-visual da imagem pelo olho humano.

O ruído de baixa frequência será adicionado aos coeficientes de baixa frequência; no entanto, o ruído de alta frequência resultará em magnitudes menores dos coeficientes de alta frequência da matriz transformada resultante.

Portanto, quando limiarmos a matriz transformada em magnitude, eliminamos todo o ruído que não faz parte dos coeficientes de alta magnitude. Portanto, algum ruído ainda estará presente que pode ser aparente após o IDCT.

Mas a idéia principal aqui é em imagens em que os dados de alta frequência são mínimos, um DCT, seguido pelo limiar de magnitude provavelmente se sairá melhor do que um filtro passa-alto típico. Se alguém puder imaginar uma imagem em que qualquer frequência da imagem tenha um componente de imagem real e um componente de ruído, em que o componente de imagem real seja pequeno ou zero, um DCT seguido de limiar de magnitude eliminará esse componente de frequência, visando principalmente o componente ruidoso. .

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.