Atualmente, estamos usando este comando dentro de um script de shell para remover o silêncio dos arquivos de áudio:
ffmpeg -i $INFILE -af silenceremove=0:0:0:-1:1:${NOISE_TOLERANCE}dB -ac 1 $SILENCED_FILE -y
Isso funciona bem, exceto que remove todo o silêncio, fazendo com que o áudio restante seja comprimido.
Como isso pode ser feito, deixando dois ou três segundos entre cada pedaço de áudio?
A solução precisa ser muito eficiente, pois processaremos muito áudio e deve usar uma ferramenta que possa ser facilmente instalada no Linux e no OSX, como ffmpeg ou sox.