Os diodos anti-saturação são conectados em paralelo ao diodo CB do transistor que deve ser mantido longe da saturação. Você está fazendo isso corretamente no npn (ânodo na base e cátodo no coletor) e deve ser feito exatamente da mesma maneira no pnp, apenas para que o diodo seja o contrário neste transistor: cátodo na base, ânodo no colecionador.
ΩΩ
Se você quiser aumentar ainda mais a velocidade, tente paralelizar os resistores de base com pequenos capacitores (aprox. 22 pF). O truque para encontrar o valor certo para o capacitor seria torná-lo um pouco igual à capacitância efetiva na base, formando assim um divisor de tensão 1: 1 para a parte de alta frequência da borda de tensão crescente ou decrescente.
Edição nº 1:
Aqui está o esquema que eu usei para verificar com o LT Spice. O sinal de entrada (retangular, 0 V e 5 V) é alimentado em três inversores BJT semelhantes, cada um usando um par complementar BC847 e BC857. O da esquerda não possui truques especiais para acelerar, o do meio usa diodos Schottky para anti-saturação e o da direita também possui um desvio de alta velocidade ao longo de cada resistor de base (22 pF). A saída de cada estágio tem uma carga idêntica de 20 pF, que é um valor típico para alguma capacitância de rastreamento e uma entrada subsequente.
Os traços mostram o sinal de entrada (amarelo), a resposta lenta do circuito à esquerda (azul), a resposta com diodos anti-saturação (vermelho) e a resposta do circuito que também usa capacitores (verde).
Você pode ver claramente como o atraso de propagação aumenta cada vez menos. Os cursores são ajustados em 50% do sinal de entrada e em 50% da saída do circuito mais rápido e indicam uma diferença muito pequena de apenas 3 ns. Se eu encontrar tempo, também posso invadir o circuito e adicionar imagens de escopo real. Um layout cuidadoso será definitivamente necessário para alcançar tempos de atraso abaixo de 10 ns na realidade.
Edição # 2:
A placa de ensaio funciona bem e mostra um atraso de <10 ns no meu escopo de 150 MHz. As imagens seguirão no final desta semana. Tive que usar minhas boas sondas, porque as baratas não mostraram muito mais do que tocar ...
Edição # 3:
Ok, aqui está a tábua de pão:
ΩΩΩμ
A primeira captura de tela mostra as formas de onda de entrada e saída em 100 ns / div e com 2 V / div para ambos os traços. (O escopo é um Tektronix 454A.)
A segunda e terceira captura de tela mostram as transições de baixo para alto e de alto para baixo na entrada com 2 ns / div (base de tempo de 20 ns com ampliação horizontal adicional de 10 x). Os traços agora estão centralizados verticalmente na tela para uma exibição mais fácil do atraso de propagação com 1 V / div. A simetria é muito boa e mostra uma diferença de <4 ns entre entrada e saída.
Eu diria que podemos realmente confiar nos resultados simulados.
Os tempos de subida e descida são provavelmente muito mais rápidos na realidade e limitados pelo tempo de subida do osciloscópio, mas não consigo pensar em nenhuma razão pela qual o atraso entre os dois sinais não deva ser exibido corretamente.
Há uma coisa a prestar atenção: em toda transição de baixo para alto e alto para baixo, os dois transistores tendem a se comportar de maneira muito breve. Em frequências mais altas do sinal de entrada (aprox.> 2 MHz), o circuito do inversor começa a receber muita corrente e faz coisas estranhas ...