Respostas:
A partir de 2012, sua melhor aposta era implementar sua computação como um shader de fragmento no GLSL ES e encontrar uma maneira de representar a saída como uma textura RGBA (32 bits).
Eben afirmou nesta palestra de 2012 que não é provável que o OpenCL seja implementado, mas que pode haver uma API desenvolvida no futuro; a resposta começa às 21:20 , e Eben diz que "podemos fornecer um meio para que as pessoas consigam calcular esse objetivo geral".
Desenvolvimentos recentes, como o projeto VC4CL , tentaram implementar o OpenCL na GPU VideoCore IV usada pelo Raspberry Pi, e outros projetos relacionados agora fornecem acesso a parte da capacidade geral de computação da GPU.
Atualmente, não há apenas uma interface de buffer de quadros para fins de exibição. Não há OpenCL e não há planos para isso, nem documentação disponível para criar o OpenCL. CUDA é apenas Nvida, portanto não é aplicável. Depois que um driver OpenGL estiver disponível, você poderá criar alguns cálculos via GPU, mas a utilidade disso ainda está por ser vista.
Confira este tópico detalhado no fórum RPi: GPU Processing API
Essa pode ser útil. Biblioteca python GPGPU para o raspberry pi. https://github.com/nineties/py-videocore
Uma GPU de uso geral (GPGPU) é uma unidade de processamento gráfico (GPU) que executa cálculos não especializados que normalmente seriam realizados pela CPU
Você pode escrever programas de alto nível que são executados na GPU do Pi usando o QPULib:
https://github.com/mn416/QPULib
É uma linguagem de programação e compilador visando os 12 processadores vetoriais (QPUs) dentro da GPU do Pi. Seu objetivo é ser fácil de usar e é implementado como um EDSL (Embedded Domain Specific Language) - uma alternativa leve a um back-end OpenCL completo.
A fundação Raspberry Pi tem sido endossando GPGPU no Pi desde 2014, logo após a Broadcom lançado documentação para as unidades QPU dentro da GPU.
Um compilador experimental do OpenCL foi criado por Simon J. Hall (o vencedor da forte competição de US $ 10.000 para fazer o Quake funcionar de maneira aceitável sem usar o GPU BLOB): veja aqui .