Já faz um tempo desde que essa pergunta foi feita, mas depois de brincar com Ruby e ffmpeg, decidi que deveria haver uma maneira mais fácil de fazer isso no Windows, e descobri que existe.
Baixe e instale o Audacity
Crie um arquivo de texto em algum lugar em que você possa encontrá-lo e cole a seguinte string: (intervalos de 300 segundos, ou seja, 5 minutos, 10 minutos seriam 600 intervalos, etc ...)
0 300
300 600
600 900
900 1200
1200 1500
1500 1800
1800 2100
2100 2400
2400 2700
2700 3000
3000 3300
3300 3600
3600 3900
3900 4200
4200 4500
4500 4800
4800 5100
5100 5400
5400 5700
5700 6000
6000 6300
6300 6600
6600 6900
6900 7200
7200 7500
7500 7800
7800 8100
8100 8400
8400 8700
8700 9000
9000 9300
9300 9600
9600 9900
9900 10200
10200 10500
10500 10800
10800 11100
11100 11400
11400 11700
11700 12000
12000 12300
12300 12600
12600 12900
12900 13200
13200 13500
13500 13800
13800 14100
14100 14400
14400 14700
14700 15000
Apenas certifique-se de que o número de intervalos seja maior que o comprimento total dos seus arquivos de áudio. Criei este que dura mais de três horas, muito tempo para minhas necessidades, acrescente mais para atender às suas necessidades.
Importe o arquivo de áudio para o Audacity e faça o equilíbrio e as outras edições desejadas e clique em arquivo> rótulos> importar rótulos
Selecione seu arquivo de texto, selecione a faixa da etiqueta e a faixa de áudio ao mesmo tempo e clique em arquivo> Exportar vários.
Altere o tipo de arquivo para o qual deseja exportar e ajuste as configurações e selecione a pasta de destino.
Sempre altero o padrão de numeração para Numeração após prefixo de nome de arquivo e digite o nome do arquivo que quero na caixa e o programa adicionará os números, pressione Export e viola!