Eu gosto do curso de Berkeley em Data Science, que dará uma boa base e um gosto por Data Science, depois de mudar para a udacity e coursera e muitos outros recursos. Portanto, se você tiver habilidades de programação, precisará de matemática, estatística e muita visualização. Também será ótimo se acostumar com o IPython, porque é essencial ver cada passo (visualizar) como ele executa, em vez de escrever um script inteiro e testar depois (o anaconda é fácil de instalar e trabalhar). O curso está listado abaixo: bcourses.berkeley.edu/courses/1267848/wiki e também o stat eu acho um bom curso gratuito do SAS: Estatísticas 1: Introdução à ANOVA, regressão e regressão logística support.sas.com/edu/schedules.html ? ctry = us & id = 1979
Começar com o ML recomendará: www.kaggle.com/c/titanic/details/getting-started-with-python
no lado esquerdo também é para Excel usando tabelas dinâmicas e o R. DataCamp lançou o tutorial sobre como usar o R. Depois de concluir essas etapas, mais competições para ganhar experiência estão no kaggle (lançado recentemente para a Classificação de crimes de São Francisco) e, finalmente, incríveis tutoriais em vídeo em www.dataschool.io
espero que ajude ...