Se neurônios e sinapses podem ser implementados usando transistores, o que nos impede de criar redes neurais arbitrariamente grandes usando os mesmos métodos com os quais as GPUs são feitas?
Em essência, vimos como as redes neurais virtuais extraordinariamente bem implementadas nos processadores sequenciais funcionam (até as GPUs são máquinas sequenciais, mas com grandes quantidades de núcleos).
Pode-se imaginar que usando os princípios de design da GPU - que consiste basicamente em milhares de unidades de processamento programáveis que funcionam em paralelo - poderíamos criar "unidades de processamento de neurônios" muito mais simples e colocar milhões ou bilhões dessas NPUs em um único chip grande. Eles teriam sua própria memória (para armazenar pesos) e seriam conectados a algumas centenas de outros neurônios compartilhando um ônibus. Eles poderiam ter uma frequência de, por exemplo, 20 Hz, o que lhes permitiria compartilhar um barramento de dados com muitos outros neurônios.
Obviamente, existem alguns desafios de engenharia elétrica aqui, mas parece-me que todas as grandes empresas de tecnologia devem estar explorando essa rota agora.
Muitos pesquisadores de IA dizem que a superinteligência está chegando por volta de 2045. Acredito que o raciocínio deles é baseado na lei de Moore e no número de neurônios que somos capazes de implementar em software rodando nos computadores mais rápidos que temos.
Mas o fato é que hoje estamos fabricando chips de silício com bilhões de transistores neles. O SPARK M7 possui 10 bilhões de transistores.
Se implementar um neurônio (não programável) e algumas centenas de sinapses requer, por exemplo, 100.000 transistores, então podemos criar uma rede neural em hardware que emula 100.000 neurônios.
Se projetarmos um chip para que possamos simplesmente torná-lo fisicamente maior se quisermos mais neurônios, parece-me que redes neurais arbitrariamente grandes são simplesmente uma questão de orçamento.
Somos tecnicamente capazes de criar, em hardware, redes neurais arbitrariamente grandes com a tecnologia atual?
Lembre-se: eu não estou perguntando se essa rede será de fato muito inteligente. Estou apenas perguntando se podemos de fato criar redes neurais arbitrariamente grandes e altamente interconectadas, se decidirmos pagar à Intel para fazer isso?
A implicação é que, no dia em que algum cientista for capaz de criar inteligência geral em software, podemos usar nossos recursos de hardware para aumentar essa inteligência geral para níveis humanos e além.