A Inteligência Artificial é um campo muito amplo e abrange muitas e muito profundas áreas da ciência da computação, matemática, design de hardware e até biologia e psicologia. Quanto à matemática: acho que cálculo, estatística e otimização são os tópicos mais importantes, mas aprender o máximo de matemática que você puder não será prejudicial.
Existem muitos bons recursos introdutórios gratuitos sobre IA para iniciantes. Eu recomendo começar com este:
http://aiplaybook.a16z.com/
Eles também publicaram dois vídeos sobre os conceitos gerais de IA. Você pode encontrá-los no Vimeo: "AI, Deep Learning e Machine Learning: A Primer "e" A promessa da IA "
Depois de entender claramente os termos e abordagens básicos da IA, você precisa descobrir quais são seus objetivos. Que tipo de software de IA você deseja desenvolver? Em quais indústrias você está interessado? Quais são suas chances de se envolver em projetos de grandes empresas? É mais fácil escolher as ferramentas certas quando você sabe exatamente o que deseja alcançar.
Para a maioria dos recém-chegados à IA, a área mais interessante é o Deep Learning. Apenas para esclarecer, existem muitas áreas de IA fora do Machine Learning e há muitas áreas de Machine Learning fora do Deep Learning. (Inteligência artificial> Aprendizado de máquina> Aprendizado profundo) A maioria dos desenvolvimentos recentes e notícias sensacionalistas são sobre DL.
Se você também se interessou pelo Deep Learning, precisa aprender sobre os conceitos de redes neurais artificiais. Felizmente, não é muito difícil entender o básico, e há muitos tutoriais, exemplos de código e recursos de aprendizado gratuitos na Web, e há muitas estruturas de código aberto para começar a experimentar.
A estrutura mais popular do Deep Learning é o TensorFlow. É apoiado pelo Google. Ame ou odeie, é um framework baseado em Python. Existem muitos outros frameworks baseados em Python também. O Scikit-learn, Theano, Keras também são mencionados com frequência nos tutoriais. (Uma dica: se você usa o Windows, pode baixar o WinPython que inclui todas essas estruturas.)
Quanto às estruturas Java, infelizmente não existem muitas opções. A estrutura Java mais importante para DL é o Deeplearning4j. Ele foi desenvolvido por uma pequena empresa e sua base de usuários é muito menor do que a multidão em torno do TensorFlow. Existem menos projetos e tutoriais para essa estrutura. No entanto, especialistas do setor dizem que as estruturas baseadas em Java acabam se integrando melhor às soluções de Big Data baseadas em Java e podem fornecer um nível mais alto de portabilidade e implantação mais fácil do produto. Apenas uma nota lateral: o Laboratório de Propulsão a Jato da NASA usou o Deeplearning4j em muitos projetos.
Se você decidir seguir o fluxo e quiser começar a aprender mais sobre o TensorFlow, recomendo que confira os canais do YouTube de "DeepLearning.TV", "sentdex" e "Siraj Raval". Eles têm bons tutoriais e algumas demos legais. E se você decidir se aprofundar, pode se inscrever em um curso on-line no udacity ou coursera.
Também pode ser interessante para você saber que existem outras estruturas de Deep Learning para a Java Virtual Machine com linguagens alternativas, por exemplo, Clojure. (Clojure é um dialeto do LISP e foi inventado por John McCarthy, o mesmo cientista da computação que cunhou o termo "inteligência artificial". Em outras palavras, existem linguagens e ferramentas de programação mais modernas e populares, mas ainda é possível / e meio legal / para usar a linguagem para IA criada originalmente para AI.A ThinkTopic em Boulder e a Freiheit em Hamburgo são duas empresas que usam o Clojure para projetos de IA. Eu recomendo que você assista ao vídeo do YouTube "OSCON 2013: Carin Meier, a alegria de voar robôs com Clojure".
(+++ Qualquer pessoa pode me corrigir se eu disser alguma coisa errada. +++)