Se alguém se interessar em cavar, acho que descobrirá que, antes que a Bell Telephone começasse a multiplexar as linhas de voz, eles fizeram muita pesquisa sobre o conteúdo de frequência da voz humana. Eles originalmente usaram grupos de teste para desenvolver a unidade de áudio bel e a distribuição de energia da voz, bem como a sensibilidade do ouvido humano a várias frequências. Eles desenvolveram uma característica de banda passante que atingiu um pico em torno de 2,1 KHz e saiu abaixo de 300 e mais de 3000 HZ. Isso deu uma boa voz humana quando feito corretamente. Tudo isso era analógico.
O rádio AM expandiu isso para 5 KHz para incluir músicas aceitáveis para a maioria das pessoas quando éramos jovens e tínhamos bons ouvidos. Os transformadores flyback da televisão foram projetados para rodar a ~ 17,5 KHz, porque havia um número mágico para a reprodução de imagense a maioria das pessoas não ouvia o lamento . O rádio de banda lateral única foi comercializado nos anos 60 e precisava de frequências de corte muito nítidas. Usei rádios com filtros de 2,1 e 3,1 KHz. 2.1 tinha algumas características do Pato Donald. 3.1 soou bem, novamente com ouvidos jovens. O passe de banda de áudio foi aumentado para 20 KHZ ou melhor com FM, porque as frequências portadoras mais altas podiam suportar uma largura de banda maior para uma melhor reprodução de música . Empilhe alguns xilofones, sinos ou outros instrumentos agudos e eles podem obter energia harmônica suficiente nas frequências mais altas. OTOH, como era o estado, a maioria das pessoas não consegue ouvir.
A conclusão é que qualquer pessoa que afirme precisar de largura de banda de 20 KHz para voz não está prestando atenção. 3 KHz farão isso, 5 darão uma margem. Se não soar bem, algo diferente da largura de banda é o problema.
Quando a sinalização digital estava sendo desenvolvida, as pessoas que sabiam descobrir que, por mais estranha que parecesse uma forma de onda, ela poderia ser dividida em um conjunto de ondas senoidais. A mistura harmônica dessas ondas produziu o padrão típico de voz ou música. Por fim, Nyquist pesquisou a taxa de amostragem digital necessária para reproduzir uma onda senoidal em uma determinada frequência. Acontece que são necessárias duas amostras para formar uma onda senoidal, de modo que a frequência mais alta que será reproduzida é metade da taxa de amostragem. Você quer 5 KHz de áudio e depois experimenta a 10 KHz. Ótimo para voz. Você deseja música com maior fidelidade do que a maioria das pessoas pode ouvir e, em seguida, amostrar a 40 KHz ou mais para obter mais de 20 KHz.
Mais um boato é amostragem vs taxa de bits. Se você amostrar em uma determinada frequência, multiplique que pelo comprimento da palavra você obterá a taxa de bits mínima necessária para produzir o sinal desejado. Reduza a taxa de bits e o tamanho da palavra de amostra será cortado para atender à nova taxa de bits em uma determinada taxa de amostra. Isso é tudo codificação "sem perdas". Isso é tudo da memória e tentando encontrar dados atuais. Está lá se alguém procurar por citações. Não vou me incomodar porque estou ficando velha demais para me importar. Eu me cansei de percorrer muitos problemas míticos óbvios quando me interessei em fazer alguma captura de áudio.