Com o Debian 9 "stretch" com uma GPU mais antiga (GT 720), são necessárias etapas adicionais. Vejo que alguém acima (@celavek) teve isso, então preencherei o que funcionou para mim. A resposta aceita cobre quase tudo o necessário. Reconhecer esse é um exemplo bastante interessante, mas espero que possa haver algumas coisas úteis aqui que salvem algumas pesquisas no Google.
Para o CUDA 8.0 na etapa 1, clique em "Versões herdadas" e selecione "CUDA Toolkit 8.0 GA 2". Em seguida, Linux, x86_64, Ubuntu, 16.04, runfile (local).
Não aceitei o driver em pacote e, em vez disso, usei os drivers 384.130 instalados anteriormente para minha GPU. Mais informações sobre isso aqui: Debian Wiki . Sua milhagem pode variar. Não posso falar de cartões que não sejam um GT 720. Esse foi o caminho que escolhi, ainda não me arrependo.
Quando a instalação falha devido a uma incapacidade do InstallUtils.pm local na etapa 12, você precisará descompactar o arquivo cuda_8.0.61_375.26_linux.run, mas executando-o com o sinalizador --tar mxvf. Então (como root) copie o InstallUtils.pm para / usr / lib / x86_64-linux-gnu / pearl-base:
./cuda_8.0.61_375.26_linux.run --tar mxvf
sudo cp InstallUtils.pm /usr/lib/x86_64-linux-gnu/perl-base
Agora o comando da etapa 12 deve ter sucesso.
Seu Debian 9.0 vem com o g ++ versão 6+, isso não serve. A compilação do vetorAdd na etapa 15 falhará. Segui este documento: Instalando várias versões do GCC para instalar a versão 5.5.0. Para 5.5.0, você desejará este arquivo
wget http://mirrors.concertpass.com/gcc/releases/gcc-5.5.0/gcc-5.5.0.tar.xz
e descompacte o tarball com isso:
tar -xJf gcc-5.5.0.tar.xz
Eu precisava atualizar algumas coisas (bibliotecas e adicionar compilação de 32 bits) para que isso funcionasse para mim:
sudo apt-get install libgmp3-dev libmpfr-dev libmpc-dev
sudo dpkg --add-architecture i386
sudo apt-get update
sudo apt-get install build-essential gcc-multilib rpm libstdc++6:i386 libgcc1:i386 zlib1g:i386 libncurses5:i386
Agora você pode configurar, criar e instalar o compilador.
Lembre-se de configurar com o sinalizador --prefix = / usr / local / gcc / 5.5.0
Agora você pode compilar o exemplo vectorAdd na etapa 15 com isso:
make HOST_COMPILER=/usr/local/gcc/5.5.0/bin/g++
Ou isto:
export HOST_COMPILER=/usr/local/gcc/5.5.0/bin/g++
make
Não há necessidade de modificar o Makefile, ele manipula a substituição do compilador corretamente.
Agora você deve ter uma instalação CUDA 8.0 em funcionamento esticada.