Estou tentando montar um currículo de matemática auto-direcionado para me preparar para o aprendizado de mineração de dados e aprendizado de máquina. Isso é motivado pelo início da aula de aprendizado de máquina de Andrew Ng no Coursera e sentindo que, antes de prosseguir, eu precisava melhorar minhas habilidades matemáticas. Eu me formei na faculdade há um tempo, então minha álgebra e estatística (especificamente das aulas de ciências políticas / psicologia) estão enferrujadas.
As respostas no tópico Um histórico sólido em matemática é um requisito total para o ML? sugerir apenas livros ou aulas diretamente relacionados ao aprendizado de máquina; Eu já examinei algumas dessas aulas e livros e não sei exatamente qual assunto de matemática estudar (por exemplo: quais campos do endereço de matemática derivam uma equação para "minimizar uma função de custo"?). O outro segmento sugerido ( Habilidades e cursos necessários para ser um analista de dados ) menciona apenas categorias amplas de habilidades necessárias para a análise de dados. O tópico Introdução à estatística para matemáticos não se aplica porque eu ainda não sou formado em matemática; um tópico semelhante O matemático deseja o conhecimento equivalente a um grau de estatística de qualidade tem uma lista incrível de livros de estatísticas, mas, novamente, estou olhando para começar a matemática a partir de uma lembrança enferrujada de álgebra e a partir daí.
Então, para aqueles que trabalham em aprendizado de máquina e mineração de dados, quais campos da matemática você considera essenciais para fazer seu trabalho? Quais matérias de matemática você sugeriria para se preparar para mineração de dados e aprendizado de máquina e em que ordem? Aqui está a lista e a ordem que tenho até agora:
- Álgebra
- Pré-cálculo
- Cálculo
- Álgebra Linear
- Probabilidade
- Estatísticas (muitos subcampos diferentes aqui, mas não sabem como separá-los)
Quanto à mineração de dados e ao aprendizado de máquina, através do meu trabalho atual, tenho acesso a registros de atividades de sites / aplicativos, transações de clientes / assinaturas e dados imobiliários (estáticos e séries temporais). Espero aplicar a mineração de dados e o aprendizado de máquina a esses conjuntos de dados.
Obrigado!
EDITAR:
Para o bem da posteridade, eu queria compartilhar uma autoavaliação matemática útil da aula de introdução ao aprendizado de máquina de Geoffrey Gordon / Alex Smola na CMU.