Por que mais largura de banda significa maior taxa de bits na transmissão digital?

Entendo que perguntas semelhantes como essa já foram feitas anteriormente neste site, listadas abaixo. No entanto, estou confuso sobre as respostas. Se eu explicar o que acho que entendo, alguém pode apontar onde estou errado?

Vou começar com o que sei:

A lei de Shannon dá o limite superior teórico

C_{n o Eu s y} = B * eu o g_{2} (1 1 + \frac{S}{N})

$C_{noisy}=B*log_{2}(1+\frac{S}{N})$

se S = N, então C = B

Como N → ∞, C → 0

Como N → 0, C → ∞

A fórmula de Nyquist diz aproximadamente quantos níveis são necessários para atingir esse limite

C_{n o Eu s e eu e s s} = 2 * B * eu o g_{2} M

$C_{noiseless}=2*B*log_{2}M$

(Se você não usar níveis lógicos suficientes, não poderá se aproximar do limite de shannon, mas usando mais e mais níveis, não excederá o limite de shannon)

Meu problema é que estou tendo dificuldade para entender por que a largura de banda está relacionada à taxa de bits. Para mim, parece que o limite superior da frequência que pode ser enviada pelo canal é o fator importante.

Aqui está um exemplo muito simplificado: sem ruído, 2 níveis lógicos (0V e 5V), sem modulação e uma largura de banda de 300 Hz (30 Hz - 330 Hz). Ele terá um limite de Shannon de ∞ e um limite de Nyquist de 600bps. Suponha também que o canal seja um filtro perfeito para que qualquer coisa fora da largura de banda seja completamente dissipada. Ao dobrar a largura de banda, duplico a taxa de bits etc.

Mas por que isso? Para transmissão digital de dois níveis Com uma largura de banda de 300 Hz (30 Hz - 330 Hz), o sinal digital de "0V's" e "5V's" será uma onda quadrada (aproximadamente). Essa onda quadrada terá os harmônicos abaixo de 30 Hz e acima de 330 Hz dissipados, de modo que não será perfeitamente quadrado. Se tiver uma frequência fundamental no mínimo 30 Hz (então os "0V" e "5V" estão mudando 30 vezes por segundo), haverá uma boa quantidade de harmônicos e uma boa onda quadrada. Se tiver uma frequência fundamental no máximo 330 Hz, o sinal será uma onda senoidal pura, pois não há harmônicos de ordem superior para torná-lo quadrado. No entanto, como não há ruído, o receptor ainda poderá discriminar os zeros dos zeros. No primeiro caso, a taxa de bits será de 60 bps, como os "0V's" e "5V" estão mudando 30 vezes por segundo. No segundo caso, a taxa de bits será no máximo 660bps (se a tensão limite de comutação do receptor for exatamente 2,5V) e um pouco menor se a tensão limite for diferente.

No entanto, isso difere da resposta esperada de 600 bps para o limite superior. Na minha explicação, é o limite superior da frequência do canal que importa, não a diferença entre o limite superior e o inferior (largura de banda). Alguém pode explicar o que eu entendi errado?

Além disso, quando minha lógica é aplicada ao mesmo exemplo, mas usando a modulação FSK (chaveamento de mudança de frequência), recebo o mesmo problema.

Se um zero é expresso como uma frequência portadora de 30 Hz, um é expresso como uma freqüência portadora de 330 Hz e o sinal de modulação é 330 Hz, então a taxa de bits máxima é de 660 bps.

Mais uma vez, alguém pode esclarecer meu mal-entendido?

Também por que usar uma onda quadrada em primeiro lugar? Por que não podemos simplesmente enviar ondas senoidais e projetar os receptores para ter uma tensão limiar de comutação exatamente no meio entre o valor máximo e mínimo da onda sin? Dessa forma, o sinal ocuparia muito menos largura de banda.

Obrigado pela leitura!

— Blue7
fonte

Pedimos desculpas pela péssima formatação, que eu não visualizei antes de postar. Eu consertei isso agora.

— Blue7

@Ignacio Vazquez-Abrams, tudo bem, isso me surpreende; Eu assumi que isso simplificaria meu exemplo. 5 ou mais Harmônicos geralmente produzem uma onda quadrada bastante decente; então, por que você precisaria de frequências fora da largura de banda para evitar distorções?

— Blue7

Em vez de pensar no que acontece com uma banda passante de 30 a 300 Hz, imagine o que aconteceria se sua banda passante fosse de 1,0 a 1,3 kHz, por exemplo.

— The Photon

@ ThePhoton: Suponho que, neste caso, você não poderá ter harmônicos de ordem superior, porque quando a frequência fundamental é de 1kHz, o 1º harmônico é de 3KHz, que fica muito fora da banda passante. Mas isso ainda me deixa confuso. Qual seria o mal em apenas transmitir a frequência fundamental?

— Blue7

primeiro alguma terminologia. O fundamental é a mesma coisa que o primeiro harmônico. Se o fundamental for 1 kHz, 3 kHz é o terceiro harmônico.

— O fóton

Respostas:

É um ponto sutil, mas seu pensamento está se desviando quando você pensa em um tom de 330 Hz como de alguma forma transmitindo 660 bits / segundo de informação. Não - e, de fato, um tom puro não transmite nenhuma informação além de sua presença ou ausência.

Para transmitir informações através de um canal, é necessário especificar uma sequência arbitrária de estados de sinalização a serem transmitidos e - este é o ponto principal - ser capaz de distinguir esses estados na outra extremidade.

Com seu canal de 30-330 Hz, você pode especificar 660 estados por segundo, mas resultará que 9% dessas seqüências de estados violarão as limitações de largura de banda do canal e serão indistinguíveis de outras sequências de estados no final, portanto, você não pode usá-los. É por isso que a largura de banda da informação é de 600 b / s.

— Dave Tweed
fonte

Na verdade, enviando apenas 30 símbolos de 2 estados por segundo, a taxa de dados é de 30 bps. Nyquist nos fala sobre o limite superior da taxa de dados, dada a largura de banda e o número de estados por símbolo. A codificação FSK escolhida não se aproxima desse limite, pois as frequências escolhidas não são ótimas. Nyquist diz que podemos escolher melhores frequências.

— 11136 le_top

@le_top: Só para deixar claro, eu não estava falando sobre modulação FSK, mesmo que o OP tenha mencionado isso em sua pergunta. Estou falando de sinalização direta de banda base (por exemplo, dois níveis de tensão). Acho que nada do que escrevi valeu uma votação. Você pode explicar o que acha errado com o que escrevi?

— Dave Tweed

* A presença ou ausência do tom de 330Hz transmite informações, pois sua presença pode ser interpretada como 1 e sua ausência como 0. A modulação está ativada / desativada. * Portanto, o 330Hz pode transmitir informações de 660bps na ausência do tom de 30Hz. O que seria barulho na fórmula de Shannon. * A confusão ainda existia depois de ler isso. * Não é explicado que a perda de 9% é explicada pelo teorema da amostra de Nyquist, indicando que o sinal é perfeitamente reconstruído a partir de precisamente 2B amostras por segundo.

— 11386 le_top

* Se você tentar fazer mais, terá efeitos alternativos, portanto, os símbolos de limitação 2B são iguais ao número de amostras. * Os símbolos 2B de cada 1 bit (2 estados) são 600bps com B = 300. * 660 estados são possíveis se os símbolos representam pelo menos 2,2 estados.

— 11386 le_top

@le_top: Realmente não entendo aonde você está indo com isso. Como não falamos sobre sistemas amostrados (de tempo discreto), a questão do aliasing nunca surge. Qual é o seu ponto em relação à pergunta em questão?

— Dave Tweed

Esta é apenas uma resposta parcial, mas espero que chegue aos pontos principais que você está entendendo mal.

Meu problema é que estou tendo dificuldade para entender por que a largura de banda está relacionada à taxa de bits. ...

Se um zero é expresso como uma frequência portadora de 30 Hz, um é expresso como uma freqüência portadora de 330 Hz e o sinal de modulação é 330 Hz, então a taxa de bits máxima é de 660 bps.

Se você mudar para 30 Hz para zero, precisará ter cerca de 1/60 s ou mais para realmente saber que você tem 30 Hz e não 20 Hz ou 50 Hz ou algo assim. Realmente, neste caso, você está apenas ligando e desligando sua operadora de 300 Hz, e o sinal de 30 Hz enviado por 1/660 s durante os zeros é apenas algo confuso.

$1/2\Delta{}f$

Portanto, neste exemplo, a taxa de bits que você pode enviar é de cerca de 20 kHz, correspondendo a 2x a diferença entre suas frequências 1 e 0, assim como a fórmula de Nyquist leva você a esperar por um código de dois níveis.

— O fóton
fonte

Suas perguntas são válidas e o caminho para uma compreensão adequada do que a teoria significa ;-).

Para a questão de quanto mais largura de banda significa uma taxa de bits mais alta, a explicação pode parecer simples, mas ruim ao mesmo tempo.

Aqui está uma explicação "ruim" que parece ok. É um começo para entender por que uma largura de banda maior contém mais dados. Suponha que eu tenha o primeiro número do canal WiFi 1 rodando a 1Mb / s, dadas as condições de energia e codificação. Depois, pego outro canal WiFi número 2, com as mesmas condições de largura de banda, energia e codificação. Também está rodando a 1Mb / s. Quando somamos os dois, dupliquei a largura de banda (dois canais diferentes) e dobre a taxa de transferência de dados (2x1Mb / s).

Se você acha que isso parece uma explicação perfeita, esquece que também dobramos o poder. O mesmo ocorre com o dobro da taxa de transferência de dados devido à energia duplicada ou à largura de banda duplicada. Na verdade, é um pouco dos dois.

Se eu mantiver a energia total igual ao dobrar a largura de banda, preciso comparar um primeiro canal WiFi rodando a 1Mb / s com a soma de dois outros canais WiFi rodando cada um com metade da energia recebida. Não vou verificar as folhas de dados dos modems WiFi, mas seria um exercício interessante para comparar com a seguinte abordagem teórica. Shannon nos ajuda a prever o que acontecerá mais ou menos se a codificação se adaptar aos níveis de energia (que é o caso do WiFi). Se a codificação não se adaptar, a taxa de dados permanecerá constante até que o nível de recepção esteja muito baixo e, em seguida, caia para 0.

Então Shannon diz: C = B ∗ log2 (1 + S / N). Ao manter a potência total, mas duplicar a largura de banda, C2 = 2 * B * log2 (1+ (S / 2) / N) em que C2 é a taxa de dados potencial. Preenchendo números reais, podemos supor que S = 2xN, para que log2 (1 + 2) = 1,58 e log2 (1 + 1) = 1. Então C = B * 1,58 e C2 = B * 2. Em outras palavras, quando meu nível de sinal na maior largura de banda é igual ao nível de ruído, a taxa de dados potencial é cerca de 26% maior que a mesma potência total emitida na metade da largura de banda. Então, teoricamente, a banda ultra estreita não pode ser mais eficiente do que a banda ultra larga com base no teorema de Shannon. E dobrar a largura de banda com o mesmo nível de energia total não dobra a largura de banda, como sugeriu nosso exemplo de WiFi. Mas a largura de banda é maior. Se pudermos negligenciar o termo "1" no log2 da expressão Shannon,

No entanto, como mencionei, a codificação deve se adaptar, deve ser otimizada para a potência e a largura de banda reais disponíveis. Se a codificação permanecer a mesma, eu simplesmente passo de operacional para disfuncional.

Mudando para sua segunda pergunta, se eu tiver um sinal FSK mudando a 30Hz com duas frequências, só posso emitir a 30bps porque estou emitindo 30 símbolos por segundo, cada um correspondendo a um bit de 1 ou 0. Se eu introduzir 4 estados ( = 4 frequências) introduzindo duas frequências entre as anteriores, porque meu nível de ruído permite, então emito a 4x30bps = 120bps. Com o FSK, não acho que a largura de banda permaneça constante ao aumentar o número de estados dessa maneira, mas certamente é possível encontrar uma maneira de mantê-la mais ou menos constante (considerando os limites de 3dB porque o espectro de frequência teórico é ilimitado).

Por que usar uma onda quadrada para o sinal "modulador"? Esta é uma opção nessa codificação que facilita a decodificação, pois no lado do receptor você simplesmente precisa ter um filtro passa-banda para cada frequência. Você ainda está emitindo "ondas senoidais" - se você estiver emitindo apenas valores "1", você terá apenas uma frequência. No entanto, as mudanças de frequência implicam a presença de "harmônicos" que permitem / acompanham essas mudanças de frequência. Outras codificações têm outras vantagens e desvantagens. Por exemplo, o Direct Sequence Spread Spectrum permite ter um sinal abaixo do nível de ruído (e, portanto, possui requisitos de energia da antena mais baixos para uma taxa de bits semelhante em muitas outras codificações), mas é mais difícil decodificar (e, portanto, requer mais energia (computação) e complexidade no circuito de decodificação).

Qualquer que seja a codificação escolhida, ela deve respeitar o teorema de Shannon, que fixa o limite superior. Você não pode apenas aplicar Shannon a uma codificação como FSK se não ajustar o nível de potência, o número de estados e outros parâmetros do sinal FSK, à medida que o nível de ruído ou o nível do sinal (distância) mudam. Shannon permite verificar a potência mínima absoluta para uma determinada largura de banda e taxa de dados. O método de codificação aumentará o limite mínimo de energia. E quando os níveis de energia excederem esse limite, a taxa de bits simplesmente permanecerá constante. A aplicação de Shannon simplesmente está incorreta se você quiser explicar que mais largura de banda significa uma taxa de bits mais alta. O exemplo de WiFi pode muito bem aplicar-se na prática a uma explicação lá, mas não é a resposta geral baseada no teorema de Shannon.

Edit: relendo sua pergunta, "No segundo caso, a taxa de bits será no máximo 660bps". Na verdade, eu não entendo completamente como você chega a 660bps, pois sua frequência muda apenas 30 vezes por segundo e você codifica em duas frequências, que é de 1 bit. Daí meus 30bps acima. Essa codificação permite um período completo a 30Hz e 22 períodos completos a 660Hz para cada símbolo. Mas 22 períodos não muda o fato de que há apenas um símbolo. Parece que algo está faltando ou que o raciocínio está errado.

Edit2: Eu entendi - você está comparando com o limite de nyquist. Esse limite de nyquist indica o limite superior da taxa de dados, dada uma largura de banda e o número de estados por símbolo. Aqui, a codificação FSK selecionada não é ótima. Você está usando 30Hz e 660Hz. O limite de Nyquist diz que 30bps = 2 * B * log2 (2), portanto, a largura de banda deve ser pelo menos B = 15Hz. Sem verificar em detalhes, diz mais ou menos que definir as frequências do FSK para 645Hz e 660Hz seria uma boa otimização da largura de banda (se o FSK for uma codificação ideal e sem verificar a largura de banda exata devido a harmônicos - os 15Hz podem ser muito altos) baixo para FSK).

Editar 3 - Explicação a seguir após uma análise mais aprofundada para explicar melhor a fonte de confusão com outra resposta e pergunta original.

A fórmula de Nyquist é baseada no teorema da amostragem, indicando que um sinal com largura de banda B é perfeitamente reconstruído a partir de precisamente 2B amostras por segundo.
Portanto, cada amostra 2B pode representar um símbolo (a intensidade pode determinar qual símbolo).
Um sinal com largura de banda de 300Hz pode ser reconstruído com 600 símbolos - nem mais nem menos.
É por isso que existe "aliasing" - a limitação da largura de banda pode fazer com que dois sinais diferentes pareçam os mesmos após a amostragem.
Se cada símbolo representar apenas 2 estados, apenas 600 bps serão possíveis.
O FSK de 30Hz a 330Hz pode representar mais de 600 bps, mas é necessário considerar mais de 2 estados por símbolo. Mas não é mais uma desmodulação do FSK, porque não se pode apenas considerar a frequência.

— le_top
fonte