Sim, alguns de nós podem fazê-lo, você pode acelerar ou diminuir a velocidade sem afetar o tom, alguns caras chamam isso de Time Stretch, existem diferentes maneiras de fazer isso, você pode fazer no domínio da frequência ou no domínio do tempo, precisará escolher o que é melhor para você, você encontrará algumas vantagens e desvantagens de cada uma.
Domínio do tempo:
No Time Domain, você pode tentar algumas técnicas como:
- TDHS (Sacalização Harmônica no domínio do tempo)
- SOLA (adição de sobreposição síncrona)
- PSOLA (adição de sobreposição síncrona de pitch)
- WSOLA (adição de sobreposição de similaridade de forma de onda)
Prós: É rápido, alguns algoritmos são fáceis de entender, boa qualidade em sons monofônicos.
Contras: Geralmente, você precisará de uma trilha de arremesso muito boa para emendar na posição correta, é difícil de fazer :-(, por isso, se sua trilha de arremesso falhar ou não funcionar com sons polifônicos, esses algoritmos fornecerão muitas falhas / artefatos no som de saída.
Domínio de frequência:
Todo o tempo que eu conheço no domínio da frequência é baseado em técnicas de fase de vocoder .
Prós: Funciona com sons polifônicos ou monofônicos.
Contras: Pode ser doloroso entender toda a matemática, a implementação é um pouco difícil, não é tão rápida como os códigos do domínio do tempo, para voz, eu prefiro resultados no domínio do tempo, alguns truques para melhorar o resultado do vocoder da fase padrão não são compartilhados.
Posso dizer que a janela e o tamanho do lúpulo são uma das chaves para a qualidade do vocoder de fase, geralmente escolhemos 4x
sobrepor à ressíntese, uma única janela de tamanho 4096
é suficiente para meus ouvidos (é claro, se você tem poder de processamento para esses tamanhos) , o vocoder de fase padrão pode adicionar alguns efeitos reverberantes. Para evitar esse tipo de problema, talvez seja necessário bloquear a fase.
Para datailed dar uma olhada no Miller Puckette e Portnoff papel