Atualização julho de 2017
Se você estiver usando o Unity ou outro mecanismo grande que possua um sistema de gerenciamento de ativos, não solicite Ogg Vorbis a seus designers e compositores de som. Obtenha WAVs ou AIFFs.
O Unity e o Unreal são estruturados para trabalhar com rejeições de alta qualidade e depois aplicar configurações de compactação por plataforma. Ter o recurso de origem como Ogg ou Mp3 significa que você está compactando duas vezes o áudio e introduzindo artefatos adicionais sem nenhum benefício.
Se você perceber que começar do ogg ou mp3 reduz o tamanho da sua compilação, esse não é um bom motivo. Provavelmente significa que você está pré-exportando com configurações de compactação diferentes das aplicadas no Unity / Unreal. Existem execuções? Sim, mas você não procuraria esta resposta se soubesse quando essas exceções eram aplicáveis.
Se você estiver pré-compactando para reduzir o tamanho do seu repositório, use o LFS, use um sistema centralizado de controle de versão ou sorria e aguarde.
TL; DR
- Sim , o MP3 320k parece ótimo. MAS . . .
- Não use MP3, use Ogg Vorbis em 44,1kHz, qualidade 6 para música. Para efeitos sonoros, use apenas 16 / 44.1 WAV, a menos que você realmente sinta que precisa cortar a gordura.
- Se você precisar usar MP3, como no Flash, tente usar 192k-256k (VBR 1 ou 2), mas talvez seja necessário aceitar 128k. Não vá abaixo de 128k (VBR 6).
A verdadeira resposta
As pessoas dirão que MP3 320kbps é sem perdas, enquanto especialistas dizem que qualquer MP3 é uma porcaria, mas no final, ninguém ouvirá uma diferença no resultado ... a menos que estejam na indústria da música há mais de 20 anos.
O áudio codificado em MP3, independentemente da qualidade da codificação, é sempre com perdas. É um codec perceptivo e, portanto, funciona codificando propriedades do som ao longo do tempo em ~ 1152 pedaços de amostra em uma forma compactada, a partir da qual amostras não compactadas podem ser extrapoladas pelo decodificador. Seu objetivo não é recriar com precisão o áudio original, apenas fornecer um que seja "bom o suficiente".
No entanto, como você disse, 320kbps parece muito bom. Geralmente, é considerado bom ou melhor que a qualidade do CD. No entanto, ainda não é possível recriar perfeitamente as amostras originais de um WAV não compactado codificado como um MP3 de 320kbps.
Geralmente, o Ogg Vorbis é um formato melhor que o MP3. É geralmente aceito fornecer uma melhor qualidade para o mesmo tamanho de arquivo e, ao contrário do MP3, pode ser facilmente repetido facilmente. Os pedaços de 1152 amostras que o MP3 usa para codificar o áudio geralmente deixam o silêncio no início e no final de um som. Não é grande coisa para efeitos sonoros básicos, mas um grande problema para loops de música.
O Flash IDE contorna isso durante a exportação .swf, elimina o silêncio manualmente. As pessoas que usam áudio de fluxo contínuo (ou mxmlc puro) conseguem fazer loop através do SampleDataEvent e soltar amostras manualmente ou pré-processar o arquivo MP3 (consulte o blog de Andre Michelle e o utilitário ComploPhase mp3loop )
Além disso, o uso de um decodificador de MP3 exige tecnicamente que você adquira uma licença de patente para usar (já que a patente do MP3 é de propriedade da Technicolor, Fraunhofer e outras). Obviamente, muitas pessoas lançaram jogos freeware que usavam MP3, mas é melhor não mexer com isso.
Qual seria o melhor formato para videogame e quais propriedades deveriam ser suficientes (Hertz, taxa de bits etc.), assumindo que o MP3 de 320kbps é "pesado"?
Talvez um exemplo ou dois, como alguns títulos AAA funcionam com seus sons.
Isso depende: Quais são suas plataformas de destino, quais outras tecnologias você está usando, como está distribuindo seu jogo e qual estilo você está adotando? Vou dividir isso em algumas categorias com base em plataforma, tecnologia e estética.
Títulos de PC e console de última geração
Os jogos AAA buscam qualidade de produção de primeira linha, por isso estão gravando e produzindo ativos sem compressão de 24 bits / 48 kHz (também o padrão para pós-produção de filmes). Títulos com ambições um pouco menores do que o Battlefield 3 podem gravar e produzir em 16 / 44.1, que é o padrão oficial para áudio com qualidade de CD.
Claro que você não pode enviar um monte de 24/48 WAVs não compactados com um jogo, seria muito grande. Então, finalmente, tem que haver algum tipo de compressão acontecendo. Geralmente, a regra geral é que, se for um efeito sonoro rápido como o de uma pistola (como a arma do Portal 2 fracassa na resposta de Sprunth), não há problema em deixá-la como WAV, possivelmente reduzindo a taxa de amostragem dependendo da frequência (consulte o Teorema de Nyquist , sons compostos de conteúdo de baixa frequência podem ser codificados em taxas de amostragem mais baixas). Para a música, não há realmente nenhuma maneira de contornar a compressão. Ogg Vorbis com qualidade de CD é o caminho a seguir (44,1kHz, qualidade 5-6 ou superior).
Além disso, os jogos AAA geralmente usam uma ferramenta intermediária para a compactação, uma ferramenta interna ou um middleware de áudio como FMOD ou Wwise. A maneira como funciona no FMOD e no Wwise é que você importa quase tudo como 16 / 44.1 ou 24/48 WAVs (ou, se o som tiver conteúdo de baixa frequência, ele pode ser importado com uma taxa de amostragem mais baixa) e forneça ao FMOD um fator de compactação para cada ativo, escolhendo uma codificação como ADPCM, MP3 ou Ogg Vorbis.
Na verdade, o FMOD recentemente abandonou o suporte para ativos de codificação nos bancos de som que você exporta do FMOD Designer (arquivos .fsb) como Ogg Vorbis em favor de um novo codec do Xiph chamado CELT . Ogg Vorbis pode ser um pouco difícil na CPU, então o CELT está sendo desenvolvido para fornecer uma alternativa. Você pode carregar os arquivos diretamente, mas não será mais usado para codificação no aplicativo Designer.
A propósito, aqui está um link interessante sobre o áudio da Battlefield Bad Company que também entra em cena um pouco. O DICE está na vanguarda da tecnologia de áudio em jogos, por isso é uma boa série de estudos.
Além disso, o surround está relacionado ao problema mono ou estéreo. Caso você não saiba, todos os seus efeitos sonoros devem ser mono, a menos que alguns deles façam uso de efeitos panorâmicos. O estéreo é estranho ao espacializar em um ambiente 3D, e você pode mover sons no código para colocá-los em um ambiente 2D.
Títulos pouco menos sofisticados, jogos independentes
Obviamente, isso pode variar bastante. Uma rápida olhada mostra que o Frozen Synapse usa arquivos Ogg Vorbis inteiramente, tanto para efeitos sonoros quanto para músicas. Dungeons of Dredmor, por outro lado, segue o esquema de Ogg Vorbis para música e 16 / 44.1 WAV para efeitos sonoros.
A abordagem Dungeons of Dredmor é preferível. Mesmo armazenados como WAVs não compactados, os efeitos sonoros geralmente são curtos o suficiente para não ocupar muito espaço, e você economiza muitos ciclos de CPU sem precisar decodificá-los. Você deseja carregar rapidamente um efeito sonoro na memória e reproduzi-lo. Se você codificar seus efeitos sonoros no Ogg Vorbis, é possível que haja um pequeno atraso antes que um jogador ouça seu efeito sonoro pela primeira vez.
Jogos de Navegador, HTML5 e Flash (com uma pitada de Mobile)
O áudio HTML5 está uma bagunça. Você deve fornecer as versões ogg e MP3 dos seus sons. Codifique com a mais alta qualidade possível, sem que o usuário fique furioso com o longo tempo de carregamento. Para MP3, não fique abaixo de 128k, é ruim o suficiente em 128.
O Flash aceita apenas MP3 de 16 bits / 44,1kHz, a menos que você enlouqueça e grave seu próprio decodificador para outro formato (como o decodificador experimental Ogg Vorbis nos laboratórios da Alchemy). No passado, o Flash tinha problemas com MP3s de taxa de bits variável, mas nunca tive um problema. A configuração de qualidade escolhida para o seu jogo em Flash dependerá do tamanho que você deseja que o seu .swf final tenha.
Atualização: Como o Tetrad mencionou , os jogos para celular precisam ser considerados com memória e armazenamento. A maneira como você codifica seu áudio para jogos para dispositivos móveis é muito parecida com o Flash. Você deseja manter a qualidade mais alta possível, mas, no final das contas, precisa ajustar um orçamento de memória e armazenamento. A música do rastreador é especialmente boa se você estiver com um orçamento apertado para armazenamento de música. Diga ao seu compositor limitar a sua paleta de amostra e você pode caber uma tonelada mais música no jogo.
Efeitos sonoros e música do tipo "8 bits" ou Chiptune
A maioria dos jogos apenas faz o que Frozen Synapse e Dungeons of Dredmor fazem. No entanto, você provavelmente pode reduzir a taxa de amostragem e a profundidade de bits. Não apenas pode se encaixar na estética que você está buscando, mas também pode economizar algum espaço.
Além disso, a música do rastreador geralmente armazena amostras em baixas taxas de amostragem, apenas permita que isso aconteça.