Não posso dizer da sua pergunta como você é adepto de matemática ou onde seu aprendizado para. Presumo que, como você é um engenheiro de software de computador, esteja familiarizado com álgebra, geometria e, talvez, algum cálculo.
Eu recomendo que você inicie seu aprendizado lendo estatísticas e compreendendo conceitos como descritivos, análise exploratória de dados, correlação, distribuições e assim por diante. Vejo que você prefere livros ao invés de vídeos, por isso vou encontrá-lo no meio do caminho e fornecer alguns livros on-line, além de um ou dois livros que você pode comprar impresso.
Primeiro, eu recomendaria o currículo do curso de pós-graduação da Penn State em estatística . Você pode explorar cada um dos cursos usando o menu à esquerda. Depois de selecionar um curso, role para baixo na página do curso e clique no link que diz "notas do curso on-line". As notas do curso para esses cursos são muito mais do que notas e são lidas como livros completos. Eles são muito instrutivos. Além disso, verifique também o currículo on-line do curso de graduação da Penn State em estatística , caso você encontre algo nos cursos de pós-graduação muito avançado e queira uma explicação "mais simples".
Segundo, revise o Handbook of Biological Statistics de John H. McDonald. Não deixe o título enganar você; este livro é uma excelente cartilha sobre estatística e análise de dados aplicável a qualquer domínio.
Terceiro, revise O Pequeno Manual de Estatística, de Gerard Dallal. Novamente, não deixe o título enganar você; este livro é outra jóia que mostra alguns fundamentos importantes de estatística.
Quarto, confira o livro Think Stats, de Allen Downey. Há uma versão gratuita online de uma edição anterior; a edição mais recente que você terá que comprar. Vale a pena, especialmente se você trabalha em Python. Neste livro, o autor ensina estatística e análise de dados usando o Python para analisar conjuntos de dados do mundo real (de brinquedo). Este é realmente um ótimo livro para se trabalhar.
Por fim, confira Data Science from Scratch, de Joel Grus. Este livro se concentra mais na análise de dados (em vez dos fundamentos estatísticos) e enfatiza mais o aprendizado de máquina e a modelagem. Ele usa o Python (e a pilha de ciência de dados do Python) para orientá-lo na análise e condução de análises preditivas em conjuntos de dados do mundo real (de brinquedo). Outro ótimo livro para trabalhar.