À medida que descubro o aprendizado de máquina, vejo diferentes técnicas interessantes, como:
- ajustar algoritmos automaticamente com técnicas como
grid search
, - obtenha resultados mais precisos através da combinação de algoritmos diferentes do mesmo "tipo", ou seja
boosting
, - obtenha resultados mais precisos através da combinação de algoritmos diferentes (mas não do mesmo tipo de algoritmo), ou seja
stacking
, - e provavelmente muito mais ainda tenho que descobrir ...
Minha pergunta é a seguinte: existem todas essas peças. Mas é possível reuni-los para criar um algoritmo que tome como entrada dados limpos e produza bons resultados tirando o melhor de todas as técnicas? (É claro que provavelmente será menos eficiente que um cientista de dados profissional, mas ele será melhor que eu!) Se sim, você tem códigos de amostra ou conhece estruturas que podem fazer isso?
EDIT: Após algumas respostas, parece que deve ser feito um estreitamento. Vamos dar um exemplo, temos uma coluna com dados categóricos, vamos chamá-lo y
e queremos prever a partir de dados numéricos X
que são manequins ou dados numéricos reais (altura, temperatura). Assumimos que a limpeza foi feita anteriormente. Existem algoritmos existentes que podem receber esses dados e gerar uma previsão? (testando vários algoritmos, ajustando-os, aumentando etc.) Se sim, é computacionalmente eficiente (os cálculos são feitos em um tempo razoável se compararmos ao algoritmo normal) e você tem um exemplo de código?
auto.arima
(da forecast
biblioteca) pode ser melhor que a dos seres humanos - Rob Hyndman mencionou várias vezes em suas apresentações. Portanto, há áreas em que alguns tipos de "aprendizado automático" são aplicados com sucesso.