A ciência de dados é muito mais ampla. É um termo genérico que, no momento, não tem uma definição muito clara. Mas a ciência de dados inclui todas as habilidades e técnicas necessárias para entender os dados com alta velocidade (chega rapidamente), volume (há muito) ou variabilidade (é confuso, como o processamento de linguagem natural). Isso significa que certamente inclui aprendizado de máquina e IA, mas também trata das ferramentas que se pode usar em uma situação do mundo real, como SQL, Hadoop ou Spark (e informações relacionadas, como conhecimento de programação paralela). Além disso, a ciência de dados pode ou não incluir o aspecto da comunicação, como criar bons gráficos e usar o Excel.
Basicamente, a ciência de dados é ML +.