Python é uma abundância de bibliotecas ML (como o ótimo scikit-learn). Existe algo bom para java / scala, contendo muitos algos (regressão, classificação, clustering, validação cruzada, processamento de recursos), estáveis e mantidos e capazes de lidar com um conjunto de dados massivo?
Acabei de encontrar o Mahout, o Breeze / Nak e o Weka, mas eles não parecem tão bons quanto os do Python.
Além disso, se não houver equivalente, como posso conectar eficientemente o código java ao Python?