A idéia de convolução
Minha exposição favorita do tópico está em uma das palestras de Brad Osgood sobre a Transformada de Fourier . A discussão sobre convolução começa por volta das 36:00, mas toda a palestra tem um contexto adicional que vale a pena assistir.
A idéia básica é que, quando você define algo como a Transformada de Fourier, em vez de trabalhar diretamente com a definição o tempo todo, é útil derivar propriedades de nível superior que simplificam os cálculos. Por exemplo, uma dessas propriedades é que a transformação da soma de duas funções é igual à soma das transformações, ou seja,
F{ f+ g} = F{ f} + F{ g} .
Isso significa que, se você possui uma função com uma transformação desconhecida e ela pode ser decomposta como uma soma de funções com transformações conhecidas, basicamente você obtém a resposta gratuitamente.
Agora, como temos uma identidade para a soma de duas transformações, é uma pergunta natural perguntar qual é a identidade para o produto de duas transformadas, ou seja,
F{ f} F{ g} = ? .
Acontece que, quando você calcula a resposta, convolução é o que aparece. Toda a derivação é dada no vídeo e, como sua pergunta é principalmente conceitual, não recapitularei aqui.
A implicação de abordar a convolução dessa maneira é que é uma parte intrínseca do modo como a Transformada de Laplace (da qual a Transformação de Fourier é um caso especial) transforma equações diferenciais ordinárias lineares de coeficiente constante linear (LCCODE) em equações algébricas. O fato de essa transformação estar disponível para tornar o LCCODE analisável analiticamente é uma grande parte do motivo pelo qual eles são estudados no processamento de sinais. Por exemplo, para citar Oppenheim e Schafer :
Por serem relativamente fáceis de caracterizar matematicamente e por poderem ser projetados para executar funções úteis de processamento de sinal, a classe de sistemas lineares invariantes a deslocamento será estudada extensivamente.
Portanto, uma resposta para a pergunta é que, se você estiver usando métodos de transformação para analisar e / ou sintetizar sistemas de LTI, mais cedo ou mais tarde, a convolução surgirá (implícita ou explicitamente). Observe que essa abordagem para introduzir convolução é muito padrão no contexto de equações diferenciais. Por exemplo, veja esta palestra do MIT de Arthur Mattuck . A maioria das apresentações apresenta a integral de convolução sem comentários e, em seguida, obtém suas propriedades (ou seja, tira-a do chapéu), ou bainha e fala sobre a forma estranha da integral, fala sobre virar e arrastar, inversão de tempo etc. etc. .
A razão pela qual eu gosto da abordagem do Prof. Osgood é que ela evita tudo o que é tsouris, além de fornecer, na minha opinião, uma profunda compreensão de como os matemáticos provavelmente chegaram à idéia em primeiro lugar. E cito:
Eu disse: "Existe uma maneira de combinar F e G no domínio do tempo, de modo que no domínio da frequência os espectros se multipliquem, as transformadas de Fourier se multipliquem?" E a resposta é sim, existe essa integral complicada. Não é tão óbvio. Você não sairia da cama de manhã e escreveria isso, e esperaria que isso resolvesse esse problema. Como conseguimos isso? Você disse, suponha que o problema esteja resolvido, veja o que deve acontecer e, então, teremos que reconhecer quando for a hora de declarar vitória. E é hora de declarar vitória.
Agora, sendo um matemático desagradável, você cobre suas trilhas e diz: "Bem, eu simplesmente vou definir a convolução de duas funções por essa fórmula".
Sistemas LTI
Na maioria dos textos DSP, a convolução é geralmente introduzida de uma maneira diferente (que evita qualquer referência para transformar métodos). Ao expressar um sinal de entrada arbitrário como uma soma dos impulsos unitários dimensionados e deslocados,x ( n )
x ( n ) = ∑k = - ∞∞x ( k ) δ( n - k ) ,(1)
Onde
δ( n ) = { 0 ,1 ,n ≠ 0n = 0 ,2)
as propriedades definidoras dos sistemas lineares invariantes no tempo levam diretamente a uma soma de convolução envolvendo a resposta ao impulso . Se o sistema definido por um operador LTI L for expresso como y ( n ) = L [ x ( n ) ] , aplique as propriedades respectivas, a saber linearidadeh ( n ) = L [ δ ( n ) ] euy( n ) = L [ x ( n ) ]
L [ a x 1( n ) + b x2( n ) ] Transformação da soma de entradas escalonadas= a L [ x 1( n ) ] + b L [ x 2( n ) ] Soma das transformações em escala,(3)
e invariância de tempo / turno
L[ x(n) ]=y(n) −→−−−impliesL[ x(n−k) ]=y(n−k),(4)
o sistema pode ser reescrito como
y(n)=L[∑k=−∞∞x(k)δ(n−k)]Tranform of the sum of scaled inputs=∑k=−∞∞x(k)L[δ(n−k)]Sum of scaled transforms=∑k=−∞∞x ( k ) h ( n - k ) .Convolução com a resposta ao impulso
Essa é uma maneira muito padrão de apresentar a convolução e é uma maneira perfeitamente elegante e útil de fazer isso. Derivações semelhantes podem ser encontradas em Oppenheim e Schafer , Proakis e Manolakis , Rabiner e Gold , e tenho certeza de muitas outras. Uma visão mais profunda [que vai além das introduções padrão] é dada por Dilip em sua excelente resposta aqui .
Note, no entanto, que essa derivação é um truque de mágica. Examinando novamente como o sinal é decomposto em , podemos ver que ele já está na forma de uma convolução. E se( 1 )
( f∗ g) ( N )f convolvido com g= ∑k = - ∞∞f( K ) g( N - k ) ,
então é apenas x ∗ δ . Como a função delta é o elemento de identidade da convolução, dizer que qualquer sinal pode ser expresso dessa forma é muito parecido com dizer que qualquer número n pode ser expresso como n + 0 ou n × 1 . Agora, escolher descrever os sinais dessa maneira é brilhante porque leva diretamente à idéia de uma resposta de impulso - é apenas que a idéia de convolução já está "inserida" na decomposição do sinal.( 1 )x ∗ δnn + 0n × 1
Nessa perspectiva, a convolução está intrinsecamente relacionada à idéia de uma função delta (ou seja, é uma operação binária que tem a função delta como seu elemento de identidade). Mesmo sem considerar sua relação com a convolução, a descrição do sinal depende crucialmente da idéia da função delta. Então, a pergunta torna-se: de onde tiramos a ideia da função delta em primeiro lugar? Tanto quanto posso dizer, remonta pelo menos ao artigo de Fourier sobre a Teoria Analítica do Calor, onde aparece implicitamente. Uma fonte para mais informações é este artigo sobre Origem e História da Convolução, de Alejandro Domínguez.
Agora, essas são as duas principais abordagens da idéia no contexto da teoria de sistemas lineares. Um favorece o insight analítico e o outro favorece a solução numérica. Penso que ambos são úteis para uma imagem completa da importância da convolução. No entanto, no caso discreto, negligenciando inteiramente os sistemas lineares, existe um sentido em que convolução é uma ideia muito mais antiga.
Multiplicação polinomial
Uma boa apresentação da idéia de que convolução discreta é apenas multiplicação polinomial é dada por Gilbert Strang nesta palestra a partir das 5:46. A partir dessa perspectiva, a idéia remonta à introdução de sistemas de números posicionais (que representam números implicitamente como polinômios). Como a transformação Z representa sinais como polinômios em z, a convolução também ocorrerá nesse contexto - mesmo se a transformação Z for definida formalmente como um operador de atraso sem recorrer a análises complexas e / ou como um caso especial da Laplace. Transformar .