Qual comando devo usar para converter um mp3arquivo wavcuja taxa de bits é variável. Ou melhor, como eu saberia se a fonte de áudio é fixedbitrate ou variable?
Qual comando devo usar para converter um mp3arquivo wavcuja taxa de bits é variável. Ou melhor, como eu saberia se a fonte de áudio é fixedbitrate ou variable?
Respostas:
Você pode obter algumas informações sobre a taxa de bits dos seus arquivos de entrada usando o ffprobe song.mp3comando No entanto, isso indica apenas a taxa de bits do primeiro quadro. O VBR em arquivos MP3 geralmente é implementado simplesmente alterando a taxa de bits de cada quadro, portanto, se o uso não pode ser determinado, basta ler o cabeçalho do primeiro quadro. Normalmente, uso outro software de reprodutor de arquivos de áudio para determinar se o VBR está sendo usado, pois muitos o exibirão (Foobar2000 faz, por exemplo).
Quando você usa codecs de saída com perdas (como MPEG-1 Camada III ou AAC), o ffmpeg escolhe uma taxa de bits padrão para o fluxo de saída ou uma taxa de bits variável. Depende do próprio codificador.
Para codecs sem perda, você não pode definir uma taxa de bits variável, pois cada amostra recebe um número predefinido de bits. ffmpeg -i song.mp3 song.wavportanto, você recebe um arquivo WAV codificado em PCM com taxa de amostragem de 44.100 Hz e 16 bits por amostra. Isso resulta em cerca de 1411 kBit / s para todo o contêiner, provavelmente muito, muito maior que o arquivo de entrada MP3.
Se você deseja um tamanho de arquivo menor para o arquivo WAV codificado em PCM, defina um formato de amostra com menos profundidade de bits (consulte a -encodersopção para obter uma lista completa deles) e / ou escolha uma taxa de amostragem mais baixa ( -ar 22050usaria 22,05 kHz, por exemplo).
Aqui está um exemplo de fazer as duas coisas:
ffmpeg -i song.mp3 -acodec pcm_u8 -ar 22050 song.wav
-sample_fmtsopção). -ar 128ksignifica que a taxa de amostragem será de 128.000 Hz, em vez dos habituais 44,1 ou 48 kHz.
ffmpeg -i song.mp3 song.wav, pois isso escolherá a taxa de bits apropriada (que provavelmente é 44,1 kHz). Se você estiver convertendo para wav, provavelmente não está querendo perder mais informações ..
ffpmegescolher a taxa de bits de amostragem correta de acordo com os song.mp3dados de entrada. Dessa maneira, o wavarquivo de bitmap de saída terá a melhor taxa de bits. Isto significa btw que o tamanho do arquivo será grande, mas com a overfitting da data: `Corrente # 0: 0: Áudio: mp3, 44100 Hz, aparelho de som, s16p, 128 kb / s`
-ar 44100é obrigatória, mesmo que o ffmpeg use automaticamente um codec de 16 bits adequado.
De acordo com o comentário naught101, eu seguiria esse processo para detectar o melhor acodec:
$ ffmpeg -formats | grep PCM
DE f32be PCM 32-bit floating-point big-endian
DE f32le PCM 32-bit floating-point little-endian
DE f64be PCM 64-bit floating-point big-endian
DE f64le PCM 64-bit floating-point little-endian
DE s16be PCM signed 16-bit big-endian
DE s16le PCM signed 16-bit little-endian
DE s24be PCM signed 24-bit big-endian
DE s24le PCM signed 24-bit little-endian
DE s32be PCM signed 32-bit big-endian
DE s32le PCM signed 32-bit little-endian
DE u16be PCM unsigned 16-bit big-endian
DE u16le PCM unsigned 16-bit little-endian
DE u24be PCM unsigned 24-bit big-endian
DE u24le PCM unsigned 24-bit little-endian
DE u32be PCM unsigned 32-bit big-endian
DE u32le PCM unsigned 32-bit little-endian
Neste ponto, considere sua plataforma para escolher entre big-endian, little-endiana escolher o bitrate:
$ ffmpeg -i sample.mp3
[mp3 @ 0x7fb33180da00] Estimating duration from bitrate, this may be inaccurate
Input #0, mp3, from 'sample.mp3':
Metadata:
title : Saturday
artist : Winterwood
album : Love In The Heart
track : 2/15
TPA : 1/1
encoded_by : iTunes 11.0.1
genre : Country & Folk
date : 1997
Duration: 00:04:27.76, start: 0.000000, bitrate: 128 kb/s
Stream #0:0: Audio: mp3, 44100 Hz, stereo, s16p, 128 kb/s
Podemos ver que esse arquivo de áudio é um mp3(isso não é óbvio, apesar da extensão do arquivo de entrada, basta verificar os bytes) tem uma taxa de bits 128 kb/s, o codec foi s16pamostrado em 44100 Hz, então escolhemos de acordo:
$ ffmpeg -i sample.mp3 -acodec pcm_s16le -ar 44100 sample.wav
Input #0, mp3, from 'sample.mp3':
Metadata:
title : Saturday
artist : Winterwood
album : Love In The Heart
track : 2/15
TPA : 1/1
encoded_by : iTunes 11.0.1
genre : Country & Folk
date : 1997
Duration: 00:04:27.76, start: 0.000000, bitrate: 128 kb/s
Stream #0:0: Audio: mp3, 44100 Hz, stereo, s16p, 128 kb/s
File 'sample.wav' already exists. Overwrite ? [y/N] y
Output #0, wav, to 'sample.wav':
Metadata:
INAM : Saturday
IART : Winterwood
IPRD : Love In The Heart
IPRT : 2/15
TPA : 1/1
ITCH : iTunes 11.0.1
IGNR : Country & Folk
ICRD : 1997
ISFT : Lavf56.4.101
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, stereo, s16, 1411 kb/s
Metadata:
encoder : Lavc56.1.100 pcm_s16le
Stream mapping:
Stream #0:0 -> #0:0 (mp3 (native) -> pcm_s16le (native))
Press [q] to stop, [?] for help
size= 46125kB time=00:04:27.75 bitrate=1411.2kbits/s
video:0kB audio:46125kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.000457%
Se você estiver no mac, pode verificar o áudio se não houver white noiseno início / fim (quando o áudio original do mp3 não tiver áudio por alguns ms / s):
$ afplay sample.wav
e, claro, você pode verificar o bitmap:
$ ffmpeg -i sample.wav
Input #0, wav, from 'sample.wav':
Metadata:
artist : Winterwood
date : 1997
genre : Country & Folk
title : Saturday
album : Love In The Heart
track : 2/15
encoder : Lavf56.4.101
encoded_by : iTunes 11.0.1
Duration: 00:04:27.76, bitrate: 1411 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, 2 channels, s16, 1411 kb/s
Use ffmpeg para converter a mídia, verifique primeiro a especificação do arquivo usando ffprobe. use este comando
ffmpeg -i kimberly.wav -acodec pcm_s16le -ar 16000 -ac 1 song.wav
Onde
-pcm_s16le is codec 16 bit conversion
-ar is sampling rate (16000samples/sec)
-ac no of audio channel