Recentemente, em uma aula de Machine Learning do professor Oriol Pujol da UPC / Barcelona, ele descreveu os algoritmos, princípios e conceitos mais comuns a serem usados em uma ampla variedade de tarefas relacionadas ao aprendizado de máquina. Aqui eu os compartilho com você e pergunto:
- existe alguma estrutura abrangente que combine tarefas com abordagens ou métodos relacionados a diferentes tipos de problemas relacionados ao aprendizado de máquina?
Como aprendo um gaussiano simples? Probabilidade, variáveis aleatórias, distribuições; estimação, convergência e assintóticos, intervalo de confiança.
Como aprendo uma mistura de gaussianos (MoG)? Probabilidade, Maximização de Expectativas (EM); generalização, seleção de modelos, validação cruzada; k-means, modelos markov ocultos (HMM)
Como aprendo alguma densidade? Estimativa paramétrica vs. não paramétrica, Sobolev e outros espaços funcionais; 2 erro; Estimativa da densidade do kernel (KDE), núcleo ideal, teoria do KDE
Como eu prevejo uma variável contínua (regressão)? Regressão linear, regularização, regressão de crista e LASSO; regressão linear local; estimativa de densidade condicional.
Como eu prevejo uma variável discreta (classificação)? Classificador Bayes, Bayes ingênuo, generativo vs. discriminativo; perceptron, decaimento de peso, máquina de vetores de suporte linear; classificador e teoria do vizinho mais próximo
Qual função de perda devo usar? Teoria da estimativa da máxima verossimilhança; estimativa de l -2; Estimativa bayessiana; minimax e teoria da decisão, bayesianismo vs frequentismo
Qual modelo devo usar? AIC e BIC; Teoria de Vapnik-Chervonenskis; teoria de validação cruzada; inicialização; Teoria provavelmente Aproximadamente Correta (PAC); Limites derivados de Hoeffding
Como posso aprender modelos mais sofisticados (combinados)? Teoria de aprendizagem de conjuntos; impulso; ensacamento; empilhamento
Como posso aprender modelos mais extravagantes (não lineares)? Modelos lineares generalizados, regressão logística; Teorema de Kolmogorov, modelos aditivos generalizados; kernelization, reprodução de espaços de Hilbert do kernel, SVM não linear, regressão de processo gaussiana
Como posso aprender modelos mais extravagantes (composicionais)? Modelos recursivos, árvores de decisão, cluster hierárquico; redes neurais, propagação traseira, redes profundas de crenças; modelos gráficos, misturas de HMMs, campos aleatórios condicionais, redes Markov com margem máxima; modelos log-lineares; gramáticas
Como reduzo ou relaciono recursos? Seleção de recursos versus redução de dimensionalidade, métodos de wrapper para seleção de recursos; causalidade vs correlação, correlação parcial, aprendizado da estrutura líquida de Bayes
Como crio novos recursos? análise de componentes principais (PCA), análise de componentes independentes (ACI), escala multidimensional, aprendizado múltiplo, redução supervisionada de dimensionalidade, aprendizado métrico
Como reduzo ou relaciono os dados? Clustering, bi-clustering, clustering restrito; regras de associação e análise de cesta de compras; classificação / regressão ordinal; análise de links; dados relacionais
Como trato de séries temporais? ARMA; Filtro de Kalman e modelos stat-space, filtro de partículas; análise de dados funcionais; detecção de ponto de mudança; validação cruzada para séries temporais
Como trato dados não ideais? turno covariável; desequilíbrio de classe; dados ausentes, dados amostrados irregularmente, erros de medição; detecção de anomalias, robustez
Como otimizar os parâmetros? Otimização irrestrita vs restrita / convexa, métodos sem derivativos, métodos de primeira e segunda ordem, adaptação; gradiente natural; otimização vinculada e EM
Como otimizar funções lineares? álgebra linear computacional, inversão de matriz para regressão, decomposição de valor singular (SVD) para redução de dimensionalidade
Como otimizar com restrições? Convexidade, multiplicadores de Lagrange, condições de Karush-Kuhn-Tucker, métodos de pontos internos, algoritmo SMO para SVM
Como avalio somas profundamente aninhadas? Inferência exata do modelo gráfico, limites variacionais nas somas, inferência aproximada do modelo gráfico, propagação de expectativa
Como avalio grandes somas e pesquisas? Problemas generalizados do corpo N (PNB), estruturas hierárquicas de dados, busca por vizinhos mais próximos, método múltiplo rápido; Integração Monte Carlo, Markov Chain Monte Carlo, Monte Carlo SVD
Como trato problemas ainda maiores? EM paralelo / distribuído, PNB paralelo / distribuído; métodos estocásticos de subgradiente, aprendizado on-line
Como aplico tudo isso no mundo real? Visão geral das partes do ML, escolhendo entre os métodos a serem usados para cada tarefa, conhecimento prévio e premissas; análise exploratória de dados e visualização de informações; avaliação e interpretação, utilizando intervalos de confiança e teste de hipóteses, curvas ROC; onde os problemas de pesquisa em ML são