Quando você tem um conjunto de dados tão grande, pode jogar com qualquer uma das técnicas de modelagem estatística e de aprendizado de máquina, e isso é altamente recomendável. Como outros sugeriram, eu também recomendaria coletar alguns milhões de amostras aleatórias dos dados e brincar com isso. Como esse é um problema de classificação, seguirei primeiro as técnicas simples de classificação e depois as mais complexas. A regressão logística é ótima para começar.
Eu queria acrescentar que modelos generativos também devem ser experimentados. O classificador Naive Bayes é um dos classificadores probabilísticos mais simples e supera muitos métodos complexos, como suporta máquinas de vetores em muitas tarefas. Você pode observar esta simples implementação do NB e este link para comparação do NB à regressão logística.
Pode-se construir um classificador Naive bayes (NB) como modelo de linha de base e, em seguida, optar por qualquer técnica de aprendizado de máquina, como máquinas de vetor de suporte (SVM) ou perceptrons de multicamadas (MLP). Uma desvantagem aqui é que o NB é computacionalmente mais barato que o MLP e, portanto, é desejado um melhor desempenho do MLP.
Chegando à sua consulta exata: O aprendizado profundo e o aprimoramento da árvore de gradiente são técnicas muito poderosas que podem modelar qualquer tipo de relacionamento nos dados. Mas e se, no seu caso, uma simples regressão logística ou RN estiver dando a precisão desejada. Portanto, é sempre melhor experimentar primeiro as técnicas simples e ter um desempenho básico. Depois, pode-se optar por modelos complexos e comparar com a linha de base.