Faz sentido converter um arquivo em uma taxa de bits de áudio mais alta?


52

Quando um determinado arquivo (mp4, flv, etc) tem uma taxa de bits de áudio de 95 kbps - faz sentido emitir uma taxa de bits mais alta ao converter para mp3 ou outro formato (com perda ou não)?

Isso resultaria em maior qualidade de áudio ou apenas em um arquivo maior?


Edita após muitas respostas + comentários:

  • Eu não estou falando sobre a saída ter melhor qualidade do que a entrada: obviamente, isso não é possível. (Exceto por passar de um formato sem perdas para a onda original.) Estou falando se uma saída com uma taxa de bits maior que a entrada terá uma qualidade melhor do que poderia ter.

  • considere que estou ciente de que a conversão entre formatos com perda não é recomendável. Somente que, em alguns casos, um cd / wave original pode estar indisponível. A questão é apenas sobre a utilidade de aumentar opcionalmente a taxa de bits durante a conversão .

  • talvez uma sub-pergunta seja útil: a resposta depende do tipo de arquivo de saída (sem perdas ou com perdas)?

  • as duas respostas mais votadas abaixo ( isto e isto ) parecem dizer coisas diferentes, a saber, mais tarde diz que as taxas de bits não são diretamente comparáveis e se o áudio original estiver em um formato mais eficiente , o áudio de saída ( menos eficiente ) deverá ter uma taxa de bits um pouco superior (a mesma idéia aqui e aqui ) - mas, embora o menos eficiente seja o mp3, não tenho certeza quais são exatamente os formatos mais eficientes . (é aac?) (- E, em geral, as respostas parecem cair em uma das duas posições representadas pelas respostas mais votadas.)


3
Se você está realmente curioso para saber por que isso não ajuda, leia sobre o Teorema da Amostragem. en.wikipedia.org/wiki/Nyquist%E2%80%93Shannon_sampling_theorem
kmort

8
@kmort O teorema de Nyquist não tem absolutamente nada a ver com isso. Ouso dizer que a maioria dos arquivos MP3 é amostrada em 44,1 kHz de qualquer maneira. A verdadeira questão é qualquer esquema lossy é aplicado na fase de codificação (filtros psicoacústicas etc.)
slhck

11
Eu não acho que ele espera que seja de qualidade superior à fonte de entrada, mas quer saber se, digamos, transcodificar um AAC de 128kbs para um MP3 de 192kbs ou 256kbs parecerá melhor do que se ele o transcodificar para um MP3 de 128kbs. Eu me perguntei a mesma coisa, já que tenho um monte de arquivos AAC que às vezes converto para MP3, já que o player de carro só entende MP3.
Johnny

2
@Johnny - exatamente: Eu uso Format Factory, que permite alterar o bitrate, então eu vagava o que era para ser feito

3
Direito; não se trata de melhorar a qualidade, mas de minimizar os danos causados ​​por outra mudança de formato. Nesse sentido, sim, um formato de destino de taxa de bits mais alto faz todo o sentido. Muitas respostas do joelho para esta pergunta.
Pergunte sobre Monica

Respostas:


90

Sim, pode realmente fazer sentido se você estiver sendo forçado a alterar os formatos.

Se você tiver um arquivo com 95kbps em um formato altamente eficiente, para manter a mesma qualidade, um formato relativamente ineficiente como o mp3 precisará de uma taxa de bits mais alta.

Claro que você nunca receberá nada de volta que foi perdido em primeiro lugar. Pelo contrário, a codificação como mp3 reduzirá ainda mais a qualidade. Todo formato com perdas usa outros meios para reduzir a quantidade de dados armazenados, descartando (simplificado) partes "desnecessárias" dos dados. Viagem de ida e volta por vários formatos diferentes e não sobrará muito ...

Portanto, se você deseja permanecer o mais próximo possível da qualidade do seu arquivo agora, escolha uma taxa de bits mais alta. 320kbps provavelmente são espaço desperdiçado, mas para mp3 é necessário algo na ordem entre 128 e 192 para manter - ou pelo menos chegar perto - da qualidade de um arquivo de 95kbps mais eficiente.


30
@Luke Em outras palavras, converter um formato de áudio flash de 96kb / s diretamente em um MP3 de 96kb / s pode causar perda adicional de dados. As taxas de bits não são diretamente comparáveis. Um arquivo MP3 de 96kb / s pode destruir os dados presentes na versão de áudio flash. Dado o tamanho do arquivo, enfim, a conversão do arquivo de 96kb / s para, digamos, um MP3 de 192kb / s é perfeitamente sensata. Obviamente, isso não melhorará a qualidade, mas evitará degradá-la ainda mais.
DBR

2
@dbr que faz mais sentido
Luke canadense REINSTATE MONICA

8
Esta é de longe a melhor resposta. Outro caso do viés do StackOverflow em favor de respostas que dizem nunca fazer algo que geralmente é uma má idéia, contra respostas que reconhecem o caso de canto.
Potatoswatter

11
Esta resposta acerta a pergunta. Deveria estar lá em cima.
Adi

2
Sim - mas nunca mude a frequência de amostragem, a menos que você tenha uma instalação profissional de engenharia de áudio e esteja fazendo algo como dominar 96kHz até 44,1 para CD.
Thomas W

49

Geralmente, isso geralmente não resulta em áudio de qualidade superior. O motivo básico é que você não pode fabricar sons que não existem no arquivo original.

Na melhor das hipóteses, o único resultado será, como você sugere, arquivos maiores.

Na pior das hipóteses, os arquivos podem até ter uma qualidade pior, pois o segundo codificador com perdas está tentando codificar a saída de um codificador com perdas anterior. Você codificará ruído e dados reais.

Pode haver benefícios em recodificar com taxa de bits mais alta se você tiver uma fonte sem perdas e estiver convertendo em uma saída com perdas. Isso minimizaria qualquer degradação na produção com perdas.

Se você puder, é muito melhor voltar à fonte original e recodificá-la com a taxa de bits mais alta necessária.


10
Na maioria dos casos, o resultado será de qualidade inferior, porque o segundo codificador com perdas tentará codificar o ruído resultante da saída do primeiro codificador.
afrazier

14
Isto lembra da outra tecnologia sem esperança ... zoom digital ...
tumchaaditya

12
Votou com isso, mas acho que você entendeu a pergunta errado. Suponha que eu tenha um dispositivo portátil que suporte apenas o formato mp3 e que todas as minhas músicas sejam arquivos wma de 96kbps. Faz sentido usar uma taxa de bits mais alta ao converter para mp3? Eu diria que sim.
yms 10/05

4
Eu diria que faz mais sentido copiar novamente seus CDs ou adquirir MP3s, em vez de recodificar a partir de qualquer mídia com baixa taxa de bits.
afrazier

10
Esta não é realmente uma resposta útil para a pergunta do OP. Certamente, recodificar em uma taxa de bits mais alta usando outro algoritmo com perdas não melhorará a qualidade, mas como a outra resposta abaixo diz corretamente, se você precisar usar, por exemplo, mp3 e AAC, provavelmente precisará usar um taxa de bits alta para evitar o máximo de perdas possível.
Alastair

7

Ao aumentar a taxa de bits, você não terá uma qualidade de som mais alta.

Pense da seguinte maneira: quando foi convertido da mídia original (digamos, um CD), ele foi compactado para caber o "conteúdo" em uma "caixa" menor e, ao fazer isso, uma quantidade de dados foi perdida (você pode deseja ler sobre formatos com ou sem perdas). Se você aumentar posteriormente a taxa de bits, estará apenas aumentando a "caixa", mas o "conteúdo" será sempre o mesmo.


11
E com isso o codificador vai "esticar" o conteúdo para tentar encaixar na nova caixa maior. Resultando em qualidade ainda pior.
Frank B

@FrankB ah ... não. O pior cenário possível com uma taxa de bits muito alta é a criação de um arquivo maior que o necessário: não fará o som pior (comparado à codificação para uma taxa de bits mais baixa).
Evilsoup

6

Primeiro, é correto que você não obtenha mais informações a partir da amostragem. Mas combinar a amostragem com um filtro passa-baixo (ou interpolação) proporcionará uma curva mais suave. Passar isso para o estéreo deve resultar em menos ruído produzido pelo estéreo, tentando reproduzir o ruído causado pela baixa taxa de amostragem original.

O fator importante aqui é que você sabe algo que seu aparelho de som não sabe. Seu aparelho de som não conhece o ruído do sinal. Pensa que o que você alimenta é o que você deseja. Mas você sabe a diferença. Você sabe que não deseja a forma do sinal original, mas uma versão mais suave. Assim, você pode coletar amostras e fazer uma curva suave antes de alimentá-la no seu aparelho de som.

Portanto, este não é o caso de adicionar mais informações, mas reduzir o ruído proveniente da baixa taxa de amostragem.


^ ótima resposta, Atle.
rthbound

é difícil fazer isso? Quero dizer: é possível dar mais conselhos sobre como fazer isso? (indique 'leitura adicional' talvez)

A taxa de bits e a taxa de amostragem são ortogonais. Além disso, a maioria dos DACs já executa um filtro passa-baixo na saída, para suavizar as etapas digitais.
fofo

De fato, muitos DACs realmente executam muitas vezes a taxa de amostragem e com uma profundidade de bits muito menor do que você imagina, contando com a filtragem passa-baixa para obter a forma de onda original. É isso o que significa oversampling (e é por isso que você pode ver, por exemplo, "DAC de 1 bit" estampado em seu aparelho de som, se você tiver o tipo de aparelho de som em que essas coisas são anunciadas).
Alastair

No entanto, o upsampling não é relevante aqui, pois estamos falando de codecs perceptivos com perda.
Alastair

4

Você não pode "melhorar" o sinal recodificando a saída em outro formato com perda (mp3 etc.). Sempre será pior que o original.

Se você precisar recodificá-lo, o melhor resultado possível é a mesma qualidade, escolhendo um codec sem perdas, como FLAC ou ALAC. Ou até mesmo formatos não compactados, como WAV.

Se não houver outra fonte para o seu arquivo, você deve manter a versão que possui.


4

Quando um determinado arquivo (mp4, flv, etc) tem uma taxa de bits de áudio de 95 kbps - faz sentido emitir uma taxa de bits mais alta ao converter para mp3 ou outro formato (com perda ou não)?

Ele pode fazer sentido, já que estamos falando de bits por segundo em diferentes formatos e não amostragem de frequência .

Como um caso extremo, suponha que você tenha um arquivo bruto não compactado com 16 bits por amostra, estéreo, na taxa de amostragem de 22 kHz. Isso equivale a 700 kbps. Você o codifica para MP3, alta qualidade, 22 kHz e circula, digamos, 64 kbps.

Suponha que agora estamos fazendo o inverso e que queremos codificar um fluxo MP3 de 64 kbps como RAW. Faz sentido aumentar a taxa de dados? Você aposta que sim. Se você não - na verdade, se você não aumentou a taxa de dados o suficiente e subiu apenas para 350 kbps - o formato RAW permitiria apenas metade da frequência de amostragem . Ou talvez apenas 8 bits por amostra. Ou talvez mono em vez de estéreo.

Por que é que? Isso ocorre porque a compactação dos dois formatos é muito diferente.

Compressão * Taxa de dados = informações (úteis).

Portanto, se você estivesse transcodificando de um formato para outro com 10% menos compactação, aumentaria proporcionalmente a taxa de dados.

Na verdade, um pouco mais que proporcionalmente, porque o segundo codificador, quando em cascata com o primeiro decodificador, sempre apresenta uma perda de qualidade adicional (a menos que você esteja usando dois formatos sem perdas) que precisa ser compensado (mesmo que você não consiga compensar tudo ).

Quando a transcodificação é direcionada para uma compactação mais alta para a mesma qualidade, aumentar a taxa de dados não faz sentido (na verdade, pode ser que você esteja transcodificando porque o formato de destino permite uma compactação melhor e, portanto, a mesma qualidade com dados mais baixos taxa).

Minha regra de ouro, no entanto, é que as informações só podem ser destruídas - portanto, transcodifique o mínimo possível e sempre tente chegar o mais próximo possível da fonte original (em termos de transcodificação de "saltos"). Isso também alcançará uma melhor compactação e / ou taxas de dados mais baixas, já que você não está carregando o barulho e os artefatos que o processo de codificação é herdeiro.


Eu acho que a pergunta é muito geral. Até onde eu entendi, o ponto principal aqui está relacionado ao formato do arquivo de entrada e saída. talvez eu deva criar uma pergunta mais simples. mas, como regra geral, não seria melhor extrair o áudio conforme sugerido em outra resposta ? ou seja, 'converter' o vídeo em áudio, mas sem tocar no som

Bem, sim. Você deve evitar a recodificação sempre que puder; qualquer manipulação só pode manter a qualidade original (na melhor das hipóteses) e geralmente piora as coisas.
Afinal

2

Esta é uma resposta complementar feita para registrar o que considero ser o significado das outras respostas até agora. Existem idéias diferentes flutuando aqui, talvez porque minha pergunta fosse muito geral ou vaga. Eu editei para esclarecer, mas o mal está feito.

  • Quando um arquivo de vídeo é a entrada, verifique (como este ou este ) que tipo de áudio contém (para os fins do que é dito abaixo, 'arquivo de áudio' também significa o áudio de uma entrada de vídeo)

  • Aumentar a taxa de bits de um arquivo de áudio não criará um arquivo com uma qualidade melhor que a original

  • A transcodificação do áudio não é recomendável em geral e deve ser evitada, principalmente a transcodificação entre formatos com perda.

  • Quando a entrada é um vídeo, a melhor maneira seria apenas extrair o arquivo de áudio (por exemplo, conforme especificado aqui, para Linux ou com um programa como o mencionado aqui, para Windows , chamado SUPER . (Após instalar e cuidado para evitar um monte de adware proposto: Selecione o Processo de Saída chamado "DeMux Extract Streams", depois de verificar o segundo caso no canto superior da janela.Arraste e solte o (s) arquivo (s) que deseja processar. Clique em "DeMux (arquivos ativos)"). - Geralmente, os vídeos que podem ser objeto de uma operação como essa contêm áudio mp3 ou aac.

  • Se você está sendo forçado a alterar formatos e converter entre formatos com perdas, isso provavelmente acontece porque você precisa de arquivos mp3; Além disso, há casos em que o áudio do vídeo de entrada não é um mp3. Portanto, para um vídeo, se não for mp3, na maioria dos casos, será um arquivo aac. Nessa situação, a taxa de bits da saída de mp3 deve ser maior (para compensar a taxa de bits mais ineficiente do mp3): para um 95kbps aac, o mp3 resultante deve ter uma taxa de bits de cerca de 128-192 kbps etc.


1

Existem algumas descrições técnicas excelentes de por que essa é uma má ideia neste tópico; para oferecer uma perspectiva diferente, imagine que toda vez que você cria um arquivo de áudio compactado com perdas (MP3, OGG, AAC), é como dobrar uma fita cassete. Mesmo se você comprar a fita mais robusta e da mais alta qualidade que puder comprar, toda vez que a copiar, tudo o que faz é minimizar os danos - ela ainda ficará um pouco mais distorcida. Quando é copiado, você está sempre perdendo um pouco de qualidade que nunca poderá voltar. Nunca, nunca, ficará "melhor".


1

Não faz sentido recodificar o áudio para uma taxa de bits mais alta, mas a taxa de bits pode ter que ser um pouco maior se você quiser reduzir uma degradação adicional na qualidade.

Você deve evitar a transcodificação do áudio sempre que possível.

Se você precisar alterar o formato do vídeo, poderá manter o áudio na mesma codificação.

Por exemplo, se você usar a ffmpegferramenta de linha de comando, poderá fornecer o argumento -acodec copypara instruí-lo a copiar dados de áudio de um contêiner para outro sem decodificá-los e recodificá-los.

Esse seria o caminho a seguir se, por exemplo, você estiver fazendo algo com o vídeo, como gravar em legendas rígidas ou alterar a resolução ou o que for.


1

Quanto ao formato de áudio mais eficiente

No geral, eu provavelmente escolheria o AAC, porque é amplamente suportado, suporta uma ampla variedade de taxas de bits e geralmente supera os concorrentes em qualquer taxa de bits. Além disso, o AAC possui um modo de baixa taxa de bits chamado HE-AAC, que emprega alguns algoritmos sofisticados para reproduzir altas frequências e estéreo de maneira a preservar a largura de banda.

Por esse motivo, o HE-AAC permite que você vá até 32 kbps para música e 16 kbps para fala, mantendo uma experiência auditiva aceitável . A União Européia de Transmissão lançou uma revisão dos diferentes codecs: http://tech.ebu.ch/docs/tech/tech3324.pdf

Pode-se concluir que, no momento, o MPEG HE-AAC parece ser a escolha mais favorável para um radiodifusor que exige uma boa escalabilidade de taxa de bits versus qualidade, até taxas de bits relativamente baixas. Além disso, a família de codecs baseados em AAC oferece excelente qualidade de áudio em taxas de bits mais altas, por exemplo, a 320 kbit / s (com exceção de "aplausos"). Nosso estudo mostra que uma qualidade excelente (em média) pode ser alcançada mesmo pela metade da taxa de bits, ou seja, 160 kbit / s, ou menos, para todos os itens de teste, exceto os itens mais críticos.

Se a compatibilidade não é uma preocupação para você, considere pesquisar no Opus. É um novo formato aberto que supostamente funciona muito bem. http://en.wikipedia.org/wiki/Opus_(audio_format)


como mp4 e flv conter AAC, a solução é, então, apenas extrair o áudio

você daria uma olhada nesta pergunta ( superuser.com/q/595777/162573 )?

11
Eu concordo com a primeira resposta. É bem apresentado. AAC é o melhor formato hoje.
Niels B.

1

É como entropia, o tempo todo em que você "converte" algo, perde qualidade, o ideal é o Demuxing, leva o áudio diretamente da fonte de vídeo sem nenhuma conversão, sua pergunta se parece com vídeos baixados do Youtube ou sites semelhantes, você pode usar o Gspot, MediaInfo ou FFprobe para conhecer a melhor qualidade do áudio nos diferentes formatos disponíveis, por exemplo, os formatos mp4 do Youtube são:

Resolution  Audio Bit Rate  Compression
1080p       192   kbps      AAC
720p        192   kbps      AAC
480p        128   kbps      AAC
360p        128   kbps      AAC
240p        64    kbps      MP3

para que você possa escolher o formato 720p e descompactar o AAC sem conversão com o FFMPEG

ffmpeg -i input.mp4 -vn -acodec copia output.aac

A '-acodec copy' diz ao ffmpeg para copiar o fluxo de áudio sem converter '-vn' descarta o vídeo (se o arquivo final permitir vídeo, o .acc não)

Existem tabelas comparativas para converter para um formato de qualidade semelhante, o MP3 tem muitos tipos de bibliotecas e configurações como OGG e ACC, então depende, eu era músico antes e, geralmente, os sons mais altos acima de 16 kHz são a chave para reconhecer a qualidade, trombetas de pratos , vozes altas ou instrumentos geralmente com muitos harmônicos, eu já fiz muitos testes antes e com um MP3 coxo normal de 192 kbps é suficiente, na verdade não posso diferenciar entre 192 e 224 kbps como muitas pessoas, 192 kbps a 160 kbps é bastante difícil é apenas para lhe dar algumas idéias ou percepções, o ACC geralmente é de melhor qualidade que o MP3, o ACC 192 provavelmente é mais semelhante ao MP3 de 256 kbps.

O ACC ou OGG 95 é semelhante ao MP3 128-160, da mesma forma, se você tiver um MP3 VBR (Taxa de bits variável), dependendo do tipo de música ou som que alguns decodificadores fornecerão uma média aleatória.

Escolha a melhor qualidade de vídeo possível, desmuxando o áudio no formato original, converta se precisar da qualidade semelhante do novo formato.

um 192 kbps no VBR MP3 é perfeito e totalmente compatível com players e telefones USB IMHO


0

Não converta se não precisar

Você pode apenas extrair o fluxo de áudio sem conversão, qualquer conversão implica perda de qualidade *.

Uma maneira de extrair o áudio é com ffmpeg:

ffmpeg -i "input.flv" -vn -acodec copy "output.mp3"

O mesmo comando pode ser usado para quase qualquer formato / vídeo, basta alterar o nome do arquivo de entrada e a extensão de saída para o desejado / correto (por exemplo, AAC para .m4a).

Arquivo Bat

Às vezes, para alguns de nós, parece complicado usar a linha de comando; se você fizer isso com frequência, poderá simplesmente criar um arquivo .bat e arrastar o arquivo de vídeo para o arquivo bat com este conteúdo:

ffmpeg -i "%1" -vn -acodec copy "%~dpn1.mp3" pause

Você só precisa alterar a extensão se estiver extraindo outro formato de áudio.

Notas

Se você precisar identificar o formato de áudio, qualquer reprodutor de vídeo decente deve ser suficiente ou você pode usar:

* Estou falando de conversões com perdas, as conversões sem perdas feitas corretamente podem manter a qualidade, mas é raro usá-las ao extrair áudio com perdas.


"extrair o fluxo de áudio sem conversão, qualquer conversão implica perda de qualidade" - bem, em seguida, se a entrada for flv, a saída não deve ser mp3, m4a, mas (recipiente para aac)

11
@cipricus "basta alterar o nome do arquivo de entrada e a extensão de saída para o desejado / correto (por exemplo, AAC para .m4a)." Além disso, você pode ver as notas das opções para identificar o formato de áudio. Eu usei flv <-> mp3 no comando de exemplo, porque estou acostumado com o youtube 240p flvs que vem com o áudio mp3.
Dan

Agradeço sua resposta, estou sempre procurando por comandos que seriam extraídos em vez de converter o áudio, e usarei seus comandos. Dê uma olhada no que eu havia postado na minha própria resposta . Como eu uso o Xfce, esta é a minha solução favorita para integrar comandos com o Thunar, a sua também pode ser adaptada a isso.

isso é só para windows?

@cipricus o comando básico deve funcionar em qualquer plataforma que funcione com ffmpeg, as instruções bat são apenas para windows. Não conheço outras plataformas, mas deve ser possível fazer algo semelhante.
Dan

0

Eu uso o Sony Sound Studio Sound Forge 10 Program. Disponível para compra no site da Sony. Você pode aumentar a taxa de bits transpondo a música original de volta para a música original, arrastando e clicando. O You Tube mostra como usar o Audio Studio. Depois Você pode ouvir instrumentos quase inaudíveis. O I-tunes mostra a taxa de bits na Biblioteca de Música. Eu tenho músicas com taxa de bits de 1411. Não é possível diminuir a taxa de bits apenas aumentar dessa maneira.


-1

Primeiro. Se você realmente quer saber como o MP3 funciona, consulte este artigo sobre a teoria do MP3 por Rassol Raissi

O artigo data de 2002, pode parecer desatualizado, mas o autor explica claramente a diferença entre a frequência de amostragem e a taxa de bits. Esses são dois conceitos totalmente diferentes.

Segundo. MP3 é um protocolo . Não é um algoritmo. Toda implementação desse protocolo - todo algoritmo, portanto, todo programa de computador - pode ser diferente.

Em terceiro lugar. Existe teoria da informação (e senso comum). Se você tiver uma amostra de 128 Kbit que representa 1 segundo de som e a fizer 192 Kbit, você adiciona 64 Kbit. Seu arquivo é maior. Mas o que esses 64K de zeros e uns adicionados representam? Realmente nada. Você não pode adicionar o que não possui. Embora o MP3 seja fortemente baseado na percepção acústica humana (mis) para fazer o trabalho, não há mágica.


-1

Para uma exposição detalhada e com conhecimento sobre esse assunto, consulte quatro artigos no The Absolute Sound de dezembro de 2011 a março de 2012. É fácil ouvir os benefícios da ampliação de amostras após converter CDs em WAV.


11
Você pode fornecer links para estes ou um resumo da solução?
James Jenkins
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.